ホーム > ライブラリー > Teradata Insight > 購買行動分析による消費者理解 > 「第10回」購買ライフスタイル・カテゴリー分析 アプローチその2
岡本 正昭 (おかもと まさあき)
流通ソリューション事業部
エグゼクティブ・コンサルタント
今回は前回に続き、利用目的のうち 3つ目の購買ライフスタイル・カテゴリー分析の「アプローチその2」を説明する。アプローチその2 はまずシステムでデータ分析し、カテゴリーを作成させるものである。
連載第9回(アプローチその1) の人間的作業であった第1ステップ、第2ステップを多少科学的に行えないかという挑戦である。
これはある日本の小売業 C社での分析例を使って、ステップを追って説明する。
この例では、データマイニングという少し高度な手法(ソフトウェア)を使っている点と、実際のデータを公開しないで説明している点でわかりにくい部分があるかもしれないが、「そういうことも出来るのか!」という感覚的理解を頂ければ幸いである
まず、ある店舗の POSレシートデータからレシート 1枚 1枚をデータマイニングのコホネンネットワーク・クラスター分析にかけ、4 x 4 = 16カテゴリー(クラスター)に自動仕分けさせる。
図1 はその結果のイメージである。
実際にはこの一つ一つのボックスに多数のレシートが入ったり、少しのレシートしか入らないボックスがあったりする。実データなので中身をお見せできないのが残念である。
ここでの4 x 4 = 16は適当であり、3 x 4 = 12であっても良いし、もっと多くても良い。希望する大体のカテゴリー数に近い設定にする。
この分析では人工知能を使っているので、「このレシートがなぜこのボックスに入れられるのか?」という理由、つまり各ボックスの特性は明示されない。ただし、それなりの違いが判定されて入れられている。特徴はこのマトリックス状のボックスの相対的位置関係には意味があるという点にある。たとえば"00"ボックス(左上)と"33"ボックス(右下)は一番性格の異なるものである。同様に"03"ボックス(右上)と"30"ボックス(左下)も互いの性格が一番違っているものである。また、"11"ボックスは"00"に極めて近い性格で、少し"33"寄りの性格ということになる。
次に各カテゴリーごとに、そこに属するレシート群をデータマイニングのアソシエーション分析(関連分析)にかけ、関連購買商品セットを見つけ出し、その頻度の高いもの上位10セットを取り出す。図2 はそのイメージサンプルである。
各カテゴリーそのものの買上上位商品と、ステップ2 で得た関連購買上位のセットの内容を見ながら、かつ全カテゴリーも眺めながら、最適と思われるカテゴリー名称を決める。この段階は完全に人間的な判断となるので、なかなかの難作業で、場合によっては長時間かかってしまう。ちなみにこの C社の例では、筆者が 1週間ほどかかってカテゴリー名称を決めた。
例では"21"と"12"はそこに入るレシートが少なかったので、的確な名称を決めることが出来なかった。つまり本来なら、16カテゴリーでなく少し減らして 3 x 4 = 12カテゴリーで分析をやり直したほうが良いか、またはレシートの数を増やして 16カテゴリーを分析できるようにするか、ということである。
以上の分析でライフスタイルやそれを指し示す商品(や、商品セット)がわかってきたのであるから、前回「第9回」の第1ステップ、第2ステップの人間的アプローチを、今回はステップ1 〜 3 でデータを基にして消化してきたことになる。 ここからの分析は基本的には前回と同様である。すなわち、色々な分析を各カテゴリー間の比較をしながら行えることになる。第9回の第4ステップ、第5ステップを参照願いたい。
以上連載第10回までで購買分析の考え方、やり方の解説は終了するが、関連したものとして、次回は「購買分析の失敗要因」、次々回は「購買分析 Q & A」を取り上げる予定である。