4つのグラフと、5つの分析手法
4つのグラフと、5つの分析手法を駆使して習得するぞ。
実務で使う分析手法は5つで十分、マーケッターこそデータサイエンティスト候補 - 日経BigData より
最初にグラフを描く
連続値のデータなら、必ずヒストグラムを描こう。分布を目で眺めると、偏りや規模感、極端な外れ値などが一目瞭然となる。
2変数の場合は、双方が連続値であれば必ず散布図を描くこと。
一方が性別や既婚・未婚のようなカテゴリカル変数の場合は、箱ひげ図(箱で中央値や四分位を示し、箱の両側から伸びるひげでデータの広がり方を示す)や複数のヒストグラムを描く。
双方がカテゴリカル変数の場合はクロス集計表だ。
分析手法は5つで十分
ビジネス課題を解決するのに必要な手法は、5つで十分だ。その5つとは、「クロス集計」「ロジスティック回帰分析」「決定木分析」「アソシエーション分析」「クラスター分析(k-平均法)」
分析の8割を占めるもの
マーケティングで使うデータはカテゴリカル変数のものが多いので、クロス集計は特に重要だ。クロス集計をする際のコツは、できるだけ単純な形にすること。望ましいのは2×2の表に落とし込むことだ。下の図は、Webサイトでの商品Aを説明する特集ページの閲覧有無と商品Aの購入有無の人数をクロス集計表にした例だ。
クロス集計表はさらなる分析の出発点
クロス集計表はさらなる分析への出発点だ。例えば、購入に至らなかった原因を探る手がかりを与えてくれる。「特集ページを閲覧した後、購入フローに進んだ人は多かったのか。それとも少なかったのか」「購入フローに進んだ人が少なかったのなら、原因は何か」というふうに、検討すべき課題が次々に浮かび上がる。
クロス集計は簡単な手法でありながらビジネスの成果に結びつくことが多いので、私は「クロス集計は分析の8割を占める」とよく言っている。直接施策につながらなくても、現状把握や仮説の導出、ターゲットの絞り込みなど、分析に重要なヒントを与えてくれるからだ。