目次
Contents
データ活用とは
近年はビッグデータやIoTなど「データ活用」というものが注目されています。
データ活用することにより、施策の評価を正しく出来ることや、作業の効率化を行うことが出来るなど様々な点でメリットがあります。方法は様々ですが、多くの企業で重要視されています。
具体的なデータ活用例では、以下のような場面で活用されています。
- 小売業界で季節ごとの購買頻度を分析して、仕入れ・在庫管理などに活用するためにビッグデータを使用する
- EC業界においては、サイトに訪れた人の購買履歴やサイト上の行動履歴から、需要の予測や価格の最適化、パーソナライズされた広告配信などを行う
ホワイトペーパーからみるデータ活用の現状
では、実際にどのようなデータ活用が行われているのでしょうか?
総務省の「令和2年版 情報通信白書」によると、5年前と比較して全体的にデータ活用は増加傾向ですが、特にPOSデータやeコマースによる販売記録、アクセスログやGPSデータといった自動取得データの活用が大きく増加していることが図1からうかがえます。
また、電話などの音声データの活用も進んでおり、データ分析による企業経営の高度化が進められていることがわかります。
また、図2のどのようにデータを活用しているのか、つまり分析手法については、「データの閲覧」と「集計」が企業規模にかかわらず約7割となっており、一方で「統計的な分析」「機械学習・AIを活用した予測」 は大企業と中小企業で大きな差があることがわかります。
図3のデータ分析を行う体制について、大企業に関しては「データ分析を行う専門部署の担当者」「各事業部門のデータ分析専門の担当者」「各業部門のデータ分析が専門ではない人」はほぼ同じくらいになっています。しかし、中小企業に関しては「各事業部門のデータ分析が専門ではない人」により分析が行われていることが多く、人材の不足がうかがえます。
いろいろな分析手法とその注意点
分析の種類には、データを属性ごとに分類して集計するクロス集計や対象を分類するクラスター分析など他にも様々な手法があります。
今回はその中でも相関係数と回帰分析の2つを説明します。
1)相関係数
この分析手法については聞いたことがある方が多いと思います。相関係数では、2つの変数関係の強さを数字で、表すことができます。相関係数は-1から1までの数字で表され、絶対値にした際に数字が大きいほど関係が強くなります。
相関係数は以下のように多くの場面で活用されています。
- 小売業界で商品の評価とリピート購入回数の関係の強さを調べ、評価の高さがリピートに繋がっているのかの参考にする
- アパレル業界において、商品の売上高と気温の関係の強さを調べ、在庫管理の参考にする
関係の強さを数字で知ることが出来る相関係数ですが、気を付けるべき点があります。それは、相関関係は因果関係を意味しておらず、必ずしも2つの変量に関係性があるともいい切ることが出来ないという点です。相関係数では、全く関係がない変数でも2つの変数が同じような数値の変化をすれば、相関係数が強く出てしまう可能性があります。そのため、相関係数だけで判断するのではなく、散布図などを利用して目で確認することや、数値が出た要因などを慎重に分析を行っていくことが大切です。
2)回帰分析
回帰分析とは、売上高を予測したいなどのビジネスの未来の予測をする場面などで使われています。売上高など目的とする指標のことを、回帰分析では目的変数といい、予測に影響を与える指標のことを説明変数といいます。マーケティング調査では目的変数として、売上高のような財務データだけでなく、広告注目率、総合満足度、購入意向率などを目標指標とするなど、様々なところで使用されています。
相関係数と回帰分析の違いとしては、因果関係を考えて定式化しているという点です。相関係数では、目的変数なのか説明変数なのかという点は考慮されておらず、因果関係を示してはいません。一方で、回帰分析は因果関係を考えて目的変数・説明変数を選択する必要があります。
回帰分析は以下のような様々な場面で活用されています。
- 小売業界で広告が売上高にどのように影響しているかを調べ、広告の効果の測定をする
- 価格や品揃えが小売店の売上高にどれくらい影響を与えているのか調べる
ここまで説明してきた回帰分析ですが、あくまで目的変数と説明変数を仮定して分析を行っており、必ずしも回帰分析の結果が因果関係を証明しているわけではありません。
そのため、
- 偶然に要因と結果の変数が同時に動いたことにより関係があるように見えてしまう
- 実は別の要因が目的変数と説明変数の両方に関係があり、直接的に関係がなくとも2つの変数の間に関係があるように見えてしまう
- 要因と思っていたものが実は結果だったというように因果関係が逆である
ということもあり得ます。関係がないのに関係があるように見えるということを疑似相関といい、因果関係を考える上では疑似相関に注意する必要があります。これらに対処して因果関係を考えるには、「もし…が起こらなかったら」というifの状況(反事実)を実験によって作り出して比較するランダム化比較実験という方法や施策の前後比較を応用して計算する差の差法という方法などがあります。
まとめ
今回は主に統計分析を中心に相関係数と回帰分析とはなにか、また使用する上での気を付ける点について述べてきました。
相関係数や回帰分析を正しく活用することにより、企業で行っている施策の評価などをより正しくに行うことが出来ます。統計分析する際にはこれまで述べた観点をぜひ意識してみてください。
参考資料:
- 総務省「令和2年版 情報通信白書」https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r02/pdf/n3200000.pdf
- 日経リサーチ「単回帰分析」https://www.nikkei-r.co.jp/glossary/id=1644
- フェリカネットワークス株式会社「ビッグデータ活用事例集」https://receiptreward.jp/solution/column/casestudy-bigdata.html
記事 : CS部 再春館製薬所PJG Y.S