そこで,データマイニングの出番になり,買い物客のデータのさまざまな組み合わせが試される。わたしたちの振る舞いがいったん四種類の記号に置き換えられたら,遺伝子のパターンを検索するアルゴリズムが適用できる。コンピューターはうなりながら,実際に何十億という組み合わせを調べはじめるだろう。その努力のほとんどは無駄骨に終わる。たとえば,芽キャベツと砂糖入りシリアルの両方を買う人々は,スイス製チョコレートも平均より多く買うだろうか?
まともな神経の持ち主なら,そんな組み合わせをわざわざ試したりはしない。だからこそ,コンピューターにはうってつけの仕事なのだ。命令されるだけで,人間には予想もできない相関関係を見つけるかもしれない。ある種の乳がんやハンチントン病の発症に関与する遺伝子領域を医学者に示すように,缶詰を買う人に勧めるべき果物とか,イヌの餌を買う人に勧めるべき雑誌とかを教えてくれるだろう。どうでもいいような提案だと思ってはいけない。宣伝をバケツごとに微調整することで,売り上げが2パーセントでも伸びれば,「マム」のシャンパンのコルクをぽんと抜く理由になる。なにしろ,利益率が0.1パーセント単位で見積もられる業界なのだ。
スティーヴン・ベイカー 伊藤文英(訳) (2015). NUMERATI ビッグデータの開拓者たち CCCメディアハウス pp.82-83
PR