2009年1月27日火曜日

ビールと紙おむつ、そして「統計はビキニのようだ」

このエントリーをはてなブックマークに追加

ビールと紙おむつ

先日、「ビールと紙おむつ」の話について、久しぶりに耳にしました。10年以上前にデータマイニングについて学んでいたときに、書籍やセミナーなどで多く取り上げられていた事例です。

米国の大手チェーンストアが購買分析をした結果、金曜日の夕方に男性がビールと紙おむつを一緒に購入しているということが判明。理由として、小さな子供のいる家庭で、妻に荷物となる紙おむつを買うように頼まれた男性が、自身が週末に飲むビールも購入しているからだと分かり、ビールと紙おむつを近くに陳列したところ、売上が向上した。


と、色々なバリエーションはありますが、基本的には上記のような内容です。
この「ビールと紙おむつ」について当時色々な人に聞いても実際の話なのかどうか定かではありませんでしたが、データマイニングの代表的な手法であるマーケットバスケット分析を説明するのにも、意外性のある2つの商品の関連性を発見したという、データの中から宝物を発見するという事例に適していたために伝説的に広がったのではないかと思います。

マーケットバスケット分析

顧客が商品を購入する場合に別な商品をリコメンドするという手法で、クロスセリングと呼ばれています。POSデータを使った購買分析の代表選手核です。

・紙おむつ,ビール
・紙おむつ,ミルク
・ビール,炭酸飲料
・紙おむつ,洗剤,ビール
・紙おむつ,ヨーグルト

例えば、上記5データの中で、「紙おむつ」と「ビール」が同時に購入されているのは、2/5で、支持率は60%です。また、「紙おむつ」を購入すると「ビール」も購入するは、「紙おむつ」を含む4データの中で2つなので、信頼性は50%。ビールを購入すると紙おむつも購入するは、2/3で信頼性は67%となります。

詳細については、データマイニング手法を参照してください。現在、発売されているのは改訂版のようですが、原著の翻訳本なのであまり内容は変わっていないと思います。翻訳本と併せて原著のData Mining Techniquesを読まれるといいかと思います。


統計はビキニのようだ

データ分析結果をレポーティングするときに、実感する名言です。最近ではセクシャルハラスメント的に捉えられてしまうかもしれませんが、統計解析で陥り易い罠について適切に表現していると思います。「統計はビキニのようだ」としか覚えていませんでしたが、WorldofQuotes.comに全文が掲載されています。
Statistics are like a bikini. What they reveal is suggestive, but what they conceal is vital.
by Aaron Levenstein

直訳すれば、「統計はビキニのようだ。露わにされている部分は思わせぶりで、隠されている部分が重要である。」って感じでしょうか。

関連記事


コメントを投稿

 
"));