データマイニングの解析法
データマイニングの解析手法の中で頻出パターン抽出というものがあります。
どのような手法かというと、データ集合の中から,高頻度で発生する特徴的なパターンを見つけ出します。次に相関ルール抽出という手法があります。どのようなものかと言うと、データベースに蓄積された大量のデータから、頻繁に同時に生起する事象同士を相関の強い事象の関係、すなわち相関ルールとして抽出する技術です。POSやEコマースの取引ログに含まれる購買履歴を利用したバスケット解析が著名です。 まずは例を見て理解してみましょう。
例1:スーパーでビデオを買った人のうちガムテープを買う人が多い → 両者を同じ場所に置く。
例2:本Aを買う人は、後に本Bを買うことが多い → 購入者に本Bを薦めるダイレクトメールを送る。
その他の頻出パターンとしては時系列やグラフを対象としたものもあります