「理論の終焉」という表現は少し引っかかる。まるで物理学や化学などの分野には理論があるが,ビッグデータ分析は概念モデルが一切不要とでも言いたげだ。
だが,そんなわけがない。そもそもビッグデータ自体は理論の上に構築されている。例えば,統計と数学の理論を使い,コンピュータサイエンスの理論も使う。重力などの現象のように因果関係のある力学の理論ではないが,一種の理論であることに変わりはない。
一方,これまで見てきたように,理論に基づくモデルには,非常に有益な予測能力が備わっている。実際,ビッグデータからは斬新な視点と新たなヒントが得られる。これは明らかに特定分野の理論にありがちな古い考え方や思い込みと無縁だからにほかならない。
もっと言えば,そもそもビッグデータ分析の土台には理論があるのだから,理論から逃げることはできない。手法も結果も理論が形作っている。
データの剪定方法からして,そうだ。我々が判断する時には,データが簡単に用意できるかどうかといった利便性を重視することもあれば,データ収集が安上がりかどうかといった利便性を重視することもあれば,データ収集が安上がりかどうかといった経済性重視の場合もある。その選択に何らかの理論が働いている。
∨・M=ショーンベルガー&K.クキエ 斎藤栄一郎(訳) (2013). ビッグデータの正体:情報の産業革命が世界のすべてを変える 講談社 pp.113
PR