Python学院
メールマガジンバックナンバー

vol.47

  • コツ・知識
  • メールマガジン

Pythonの「pandas」と「Matplotlib」を使ったデータ分析について
【コードもご紹介します】

今回のテーマは
「pandasとMatplotlibを使用したデータ分析」についてです。
でございます。

(約5分で読めます)
~~~~~~~~~目次~~~~~~~~~
1.はじめに~データ分析のメリットとは?
2.データ分析でどんなことができるの?
3.Pythonを使ってデータ分析をしてみよう!
4.おわりに
~~~~~~~~~~~~~~~~~~~~

1.はじめに~データ分析のメリットとは?

データ分析によるメリットは、以下のようなものがあります。
1.現状について正しく把握できる
2.感覚ではなく、明確な根拠を持って予想を立てることができる
3.仕事の優先順位をつけ、業務改善のきっかけを作ることができる
「Aが正解だと思っていたが、実はBが正解だった」ということは、頻繁に起こります。
現状について把握し、「どこに課題があるのか」や「原因は何なのか」を特定することで、
改善につなげることがデータ分析の目的です。
また、データ分析の手法として、昨今ではAIや機械学習の利用が注目されています。


2.データ分析でどんなことができるの?

次に、データ分析の活用事例を3つご紹介します。
■事例1 従業員の生産性を向上させた
■事例2 政策の立案をした
■事例3 業績向上を目指す

■事例1 従業員の生産性を向上させた
自動車などの加工を行う企業が、設備や製造マシンの稼働状況を自動で取得・分析をしたものです。
いつどの程度稼働しているかなどを把握し、どの時間を効率化できるかが分かりました。
結果として生産性は2.2倍上がり、残業時間も月3,000時間以上削減できました。
■事例2 政策の立案をした
ある県では観光客をリピーターにするため、観光ルートや観光で消費する費用に関するデータを取得・分析しました。
その結果、有名な観光地以外のアウトレットモールにも立ち寄る人が多くいることが分かりました。
実際にクーポン活用などの政策を立案し、
一部は令和3年度以降に順次実施される予定だそうです。
このように、多くの自治体でもデータ分析が行われています。
■事例3 業績向上を目指す
こちらはインソースの事例です。
弊社では日々の売り上げ金額を取得し、どの研修が人気かを把握しました。
その結果を踏まえてランキング形式で研修を紹介したところ、
お客様が研修を選びやすくなり、売上の拡大にもつながりました。




3.Pythonを使ってデータ分析をしてみよう!


Pythonで実現する方法をご紹介します。
※今回はPythonの基本は理解している方向けです。
Pythonの基本が知りたい場合は、こちらの研修がおすすめです。
→Python学院~基本文法編/プログラミング未経験から業務への活用方法を学ぶ(1日間)
https://www.insource.co.jp/bup/bup_python_programming_basic.html

今回はA~Eの5人の学生が500点満点のテストを2年間受け、
得点がどのように変化したかを可視化してみる場合を想定します。

■データ整形<
「pandas」という、数値の計算とデータの加工を行うためのライブラリを使います。
今回は、A~Eの5人の学生の成績を1年生の1,2,3学期と2年生の1,2,3学期の、
計6回のテストの合計点を並べた表を作成します。

(1)データを操作し、表を作成する
import pandas as pd
df = pd.DataFrame({'名前':['A','B','C','D','E'],
         'year1/1Q':[352,432,449,258,480],
         'year1/2Q':[369,428,478,266,477],
         'year1/3Q':[381,397,432,243,483],
          'year2/1Q':[397,354,464,270,472],
          'year2/2Q':[403,336,481,261,465],
          'year2/3Q':[420,348,477,244,488],
          })
df

year1/1Qという表記は、何年生/何学期を表しています。
そして、このコードを実行すると、以下の表が出てきます。


(2)行列を入れ替える
df2 = df.T

結果は以下のグラフになります。



■データの可視化
次は「Matplotlib」というライブラリを用い、表データをグラフにします。
今回は、pandasで整形した「5人のテストの合計点の変化」をグラフにします。

(3)グラフを描画する
import matplotlib.pyplot as plt
df3 = df2[1:]
df3.plot.line()

5人の学生の時間的な変化を分かりやすくするため、
以下のように折れ線グラフにしました。


このように、簡単なコードでデータを可視化することができます。
この他にも集計や予測ももちろんPythonで行うことができます。
「他のデータ分析の方法についても知りたい」
「データ分析のやり方は少し分かったけど、業務での活用方法が想像つかない...」という方は、
ぜひ弊社のPython研修もご検討くださいませ!
→Python学院~データ分析編/統計の基礎とPandasライブラリの活用(1日間)https://www.insource.co.jp/bup/python_business_data_analysis.html


4.おわりに

今回は、「データ分析とは何か?」や「Pythonを使用したデータ分析」についてお伝えしました。
次回は、弊社のPython学院チームの新しい研修の1つである、
「Python学院~データ分析編/統計の基礎とPandasライブラリの活用(1日間)」
の魅力をご紹介いたします。
研修の内容についてはもちろんのこと、
演習問題やテキストの一部もお見せする予定です!




また上記に、前回と同様に画像生成AIを使用して画像を作成しました!
解答は、この記事の右下に記載しております。

本日も最後までお読みいただき、ありがとうございます!
それでは、次回もお楽しみに!

A. 梅(plum)


関連研修