忍者ブログ

I'm Standing on the Shoulders of Giants.

読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。

   

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

相関と因果

ビッグデータの時代にあっては,このような考え方が一般的になってきている。たくさんの情報に囲まれているときに,誰が理屈など必要とするだろうか。しかし,予測するときの姿勢として,これは絶対に間違っている。特にノイズの多いデータを扱う経済の分野では致命的だ。統計的な推論は,理論に裏づけされたときに強固なものとなる。少なくとも根本的な原因だけは真剣に考えてみるべきだろう。2011年9月の時点で,悲観的な見方にはいくつかの根拠——ヨーロッパの債務危機など——があったことは間違いないが,ECRIは見るべきものを見ていなかった。代わりに,たくさんの変数をごった煮にして,相関関係と因果関係を取り違えたのである。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.216
PR

当たらない

実際には,エコノミストがGDP成長率を予測するときの90パーセント予測区間——実際に検証されたもの——は,およそ6.4ポイントにおよぶ(プラスマイナス3.2パーセントの誤差に相当する)。
 つまり,来年のGDP成長率が2.5パーセントになる見込みという報道があれば,それは5.7パーセントになるかもしれないし,マイナス0.7パーセントになるかもしれないということだ。後者ならかなり深刻な景気後退である。エコノミストの予測は昔からこの程度であり,改善していることを示す証拠もない。過去6回の景気後退のうち9回を当てたと自慢するエコノミストの笑い話も,さもありなんという気がしてくる。ある統計によれば,1990年代に世界中で起きた60回の景気後退のうち,1年前にエコノミストが予測できたのは2つだけとなっている。
 エコノミストだけではない。このような結果はよくあることだ。専門家という人たちは,地震の予測のなかの不確実性を正直に伝えることを苦手としている。あるいは,そうすることにまったく関心を持っていない。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.200

ノイズをシグナルとして

ノイズをシグナルと間違えるという私たちの性質は,ときとして悲惨な結果をもたらす。日本は地震活動が活発な国であるのに,2011年の壊滅的な地震(東北地方太平洋沖地震)に備えていなかった。福島の原子炉はM8.6の地震には耐えられるように建てられていたが,M9.1には耐えられなかった。地震により発生した130フィート(約40メートル)という規模の津波が過去にもあったことは,考古学的な資料からうかがえたが,忘れられたか無視されたようだ。
 M9.1という地震は世界中のどこを見てもきわめてまれである。10年単位でも予測することはできなかっただろうが,日本の科学者や政府関係者は,その可能性を最初から否定してしまった。これも過剰適合の事例と言えるかもしれない。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.184-185

予測と予想

アメリカ地質調査所もある意味,言葉遊びをしている。予測(prediction)と予想(forecast)という言葉は,さまざまな分野でさまざまな形で使われている。同じ意味で使っている分野もあるし,区別している分野もある。しかし地震学の世界ほど,その違いに敏感な分野はないだろう。地震学者は次のように区別している。

・予測(prediction)とは,いつ,どこで地震が発生するか限定したものをいう。(例)6月28日,日本の京都で大地震が起きるだろう。
・予想(forecast)は,長期間にわたる確率論的な事象を表す用語である。(例)この先30年間に南カリフォルニアで大地震が起きる確率は60パーセントである。

 アメリカ地震調査所の公式な立場は「地震は予測(prediction)できない」というものだ。しかし,予想(forecast)はできる。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.164-165

予想外のとき

人は,晴れの予報だったのに雨が降ったというような間違いに注目するものだ。もし予想外に雨が降ったら,せっかくのピクニックが台無しになったと天気予報をなじるだろう。一方,予想外に晴れたらラッキーだと思う。科学的にはどうかと思うが,とローズ博士は前置きしてから言った。「予報が客観的なものであれば,つまり降水予想にバイアスが一切なければ,たぶん我々は困ったことになるだろうね」

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.149-150

雨のバイアス

民間企業の天気予報に関しては,どれほど正確かという統計的な現実は必ずしも重要ではない。消費者が正確だと認識することに価値がある。
 たとえば,民間企業の天気予報では,降水確率50パーセントという言い方はめったにしない。消費者の目にはどっちつかずで優柔不断に映るからだ。そのため,正確性や正直さを多少犠牲にしてでも,切り上げて60パーセント,あるいは切り下げて40パーセントとしている。
 フレアは,こうした数字のごまかしについて明かしてくれた。だから民間企業の天気予報には意図的なバイアスがかかっている。特に降水確率については実際より高くなるようにバイアスがかかっているようだ。これを気象学者は“雨のバイアス”と呼んでいる。たいてい,公的機関の予報との差が大きいときほど強いバイアスがかかっている。民間企業の天気予報は“価値を足すために正確性を引いている”のである。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.147

些細な間違いが

データに誤りがあるところには問題が生じる(あるいは,CDOのように,前提に誤りがある場合に問題が生じる)。たとえば,5足す5を計算するときに,キーを誤って押したとしよう。5足す5の代わりに5足す6とした場合だ。本当は10になるはずなのに,11という結果が出る。間違ってはいるが,たいした差ではない。足し算の結果は線形なので,誤りには寛容だ。しかし,指数関数的な計算では,データの誤りは厳しく咎められる。5の5乗(=3215)と5の6乗(=15625)では,結果が大きくかけ離れてしまう(500パーセントも違う)。
 プロセスが動的であれば——つまり,ある段階でのアウトプットが次の段階のインプットになっているときには——事態はさらに深刻になる。たとえば5を5乗し,その結果を5乗するとしよう。先ほどと同じ間違いをした場合,その差は3000倍となる。些細な間違いがどんどん大きくなるのである。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.132

形而上学の実践

天気予報が形而上学の実践だと言ったら驚くかもしれないが,天気を予測するという考え自体が,予定説対自由意志という議論を呼び起こすものなのである。ロフトは言う。「すべては決められているのか,それとも私たちが自分自身で決めるのか。これは人類にとって基本的な命題だ。そして2つの考え方がある」
 「1つは聖アウグスティヌスとカルバン主義だ」。ロフトは予定説を唱えた2人をあげた。この考えのもとでは,人間に世界がどうなるかを予測する力はあるかもしれないが,それを変える力はない。すべては神の計画にしたがって進む。「これに反対するのが,イエズス会とトマス・アクィナスで,私たちには自由意志があるとした。問題は世界が予測可能なのか,それとも不可能なのか,ということだ」

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.124

革新者

革新者というのは,大きく考えると同時に小さく考える。新しいアイデアは,ほかの人が面倒くさがって取り組まない問題の細部に宿っているものだ。そして,抽象的なことや哲学的なことを考えているときに,ふと見つけたりする。世の中のあり方を考えたり,支配的な枠組みに代わるものはないかと考えたり,といったときだ。新しいアイデアは,この2つの領域にはさまれた,私たちが人生の99パーセントを過ごす場所では見つからない。分類してどこかに当てはめるという,私たちが普段おこなっている方法では有益な情報を見逃してしまう。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.119

杭のせい

私たちは四角い杭が丸い穴に入らないとき,たいてい杭のせいにする。情報に接したときには,直感的に分類する。普通はわかりやすいように少ない数に分ける(国勢調査局が数百もある民族をたった6つの人種に分類していることや,数千のアーティストをいくつかのジャンルに分類していることを考えればわかるだろう)。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.114

ファイブ・ツール

長らく野球のスカウトが採用してきた評価手法に「ファイブ・ツール」というものがある。パワー,ミート力,足の速さ,肩の強さ,守備力だ。当然ながら批判も多い。四球を選ぶ,三振を避けるといった,打席での能力は項目に入っていない。また,すべての項目が同じように重要であるような印象をあたえてしまうが,実際にはショートと捕手以外のポジションでは,パワーがほかの項目よりはるかに重要となる。
 ファイブ・ツールの各項目の評価が,実際の成績に結びつくのかという問題もある。ファイブ・ツールが本当に有効であるとすれば,選手がマイナーリーグの階段をのぼるにつれて,各項目の評価が統計データに反映されていかなければいけない。ミート力は打率に,パワーは長打数になってあらわれなければ意味がない。たとえば,スカウトがマイナーリーグのある選手のパワーに80点中70点を与えたとしても,1シーズンに10本のホームランを打つのに苦労しているとすれば,そのレポートは信頼できるだろうか。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.106-107

客観的

本書では,「客観的」と「主観的」という言葉を注意して使っている。客観的という言葉は定量的という意味で使われることがあるが,実際には違う。客観的とは,個人のバイアスを超えて,問題の真実を見ることを言う。
 客観的であることは理想だが,いつも客観的でいることは難しい。予測にはさまざまな方法がある。世論調査のように定量的な変数だけをよりどころにする方法もあるし,ワッサーマンのアプローチのように定性的な要素を考慮する方法もある。いずれも,予測を導き出すのは人間の判断であり,人間の判断があるところにはバイアスがつきものだ。自分の仮定が予測にどのような影響を与えるかを常に自問しなければならない。とりわけ政治の世界では,どこを向いてもイデオロギー的な傾向が目につくうえに,誰もがノイズの多いデータから整然とした物語を編み出そうとしているので,客観的であろうとするのは容易ではない。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.79-80

予測の不確実性

しかし,政治家や政界関係者は,この確実ではない世界を見ると混乱してしまうようだ。2010年,私はある民主党議員に,選挙の数週間前に呼ばれた。西海岸の民主党が強い地区の議員だった。その年は民主党が優勢だったにもかかわらず,自分の議席が心配になったらしい。彼は私のサイトの予測にどのくらいの不確実性があるのか知りたがった。限りなく100パーセントに近い確率での勝利が予想されていたが,それは99パーセントなのか,99.99パーセントなのか,はたまた99.9999パーセントなのか。最後の確率——100万分の1の確率で落ちることになる——であれば,自分の選挙資金を劣勢な地域の候補者に提供するという。どうやら100分の1のリスクは許容できないらしい。
 一方,予測の不確実性というものを間違って解釈している人もいる。予測が間違ったときの言い訳だと思っているようだが,それは違う。現職の議員が90パーセントの確率で当選すると予測するときには,10パーセントの確率で落選すると予測しているのである。よい予測というのは,長い目で見てこれらの確率がおおむね一致するものをいう。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.70

道を見失う

人は物語のなかに身をおくと,道を見失う。政治の分野で特に予測が当たらないのは,人間的な要素が強いからだ。巧みな選挙戦は,私たちのドラマに対する感性を刺激する。だからこそ,政治の予測には慎重な態度でのぞまなければいけない。感情を押し殺せとまでは言わないが,せめてキツネのように現実を直視するよう心がけた方がいい。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.64-65

予測できたか

ソビエト帝国の崩壊は必然の結果のように思えるかもしれないが,それを予測できた政治学者は一握りで,彼らは嘲りの対象となっていた。政治学者がソ連の崩壊——おそらく20世紀後半において最も大きな出来事だろう——を予測できないとすれば,ほかに彼らがすべきことなどあるのだろうか。
 当時,カリフォルニア大学バークレー校で心理学と政治学を専門としていたフィリップ・テトロックは,同じような疑問を持っていた。そこで彼は前例のない大胆な実験に着手した。1987年,学界や政界の大勢の専門家から,国内政治,経済,国際関係というさまざまな項目についての予測を集めはじめたのである。
 その結果,政治の専門家はソ連の崩壊を予期できなかったことがわかった。体制の崩壊を予測し,その理由を理解するためには,さまざまな議論を1つにまとめる必要があったからだ。これらの議論は本質的に矛盾するものではなかったが,政治領域のなかで異なる立場にいる人々から出てくるため,1つのイデオロギー陣営に身を置く学者にとっては,両方の議論を受け入れることは難しかったのである。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.56

運が

予測が大外れだったことを言い訳するときには,いくつか選択肢がある。1つは外部の環境のせいにすることだ。「運が悪かった」というやつだ。これが理由として正しいときもある。国立気象局が90%の確率で晴れといったのに実際には雨だったとしても,「ゴルフが台無しになった!」と本気で気象局を責める人はいないだろう。事実,過去のデータは,気象局が10分の1の確率で雨だと言うとき,長い目で見れば10パーセントの確率で実際に雨がふることを示している。

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.22

パターンを見いだす

「人間はほかの動物よりも,パターンを見つけ出す必要に迫られている」。マサチューセッツ工科大学の神経科学者であり,人間の脳がどのように情報を処理するかを研究しているトマソ・ポッジオに聞いた話だ。「さまざまな状況のなかで物体を認識するということは,一般化するということだ。生まれたばかりの赤ちゃんは,人の顔の基本的なパターンを認識できるが,これは進化によって得たものであり,個人の力によるものではない」
 問題はこの進化の過程で得た本能により,実際にはないパターンを見てしまうことだ,とポッジオは言う。「誰もがやっていることだ。ランダムなノイズのなかにパターンを見いだすんだよ」

ネイト・シルバー 川添節子(訳) (2013). シグナル&ノイズ:天才データアナリストの「予測学」 日経BP社 pp.14

人間のあり方そのもの

世界が偶然の寄せ集めととらえられることに気づいたとき,そういう偶然性を,なんとか必然性へと読みかえようとするこころみ,その1つが占いなのではないだろうか。われわれの人生,また世界に起きることに,理由や根拠をあたえ,世界を秩序づけられたものとしてみることを,占いはおこなおうとしているのだと考えられるのである。その意味で,占いは,人間というもののあり方そのものに根ざしており,それゆえ,はるか昔から今にいたるまで,人間は占い行為をおこなうのであり,おそらく,このあとも,どんなに科学が進歩しようと,占いに頼る人がいなくなることはないだろう。

板橋作美 (2004). 占いの謎:いまも流行るそのわけ 文藝春秋 pp.216

因果関係の説明

もちろん,だから予兆とか占いはまやかしだと言おうとしているのではない。出来事は,むしろ,あとでしか説明できないと言いたいのである。因果関係というのは,因がまずあってのちに果があることであり,出来事の連鎖で言えば,ある出来事が原因となって結果としてある出来事が起きるということのはずだが,われわれは,むしろ逆に,結果がまずあって,そのあとで,その原因としての出来事を想起する。そして,想起された過去の出来事が,のちに起きた出来事の原因として説明に使われるのである。

板橋作美 (2004). 占いの謎:いまも流行るそのわけ 文藝春秋 pp.201-202

再編成

占いは,バラバラで,一貫性がなく,その場かぎりとしか思えない過去・現在・未来の出来事,人生,性格などを,たがいに関連づけられたものとして,1つの統一体として見ることを可能にする視点をあたえるのだと考えられる。それが,ある相のもとで人生を見るということなのだろう。性格について言えば,それによって,自分の行動,好き嫌いなどが,たがいに関連づけられ,一貫したものに見えてくるのである。人生は,性格は,占いによって読みとった相のもとで,再編成され,再解釈されるのだ。

板橋作美 (2004). 占いの謎:いまも流行るそのわけ 文藝春秋 pp.199-200

bitFlyer ビットコインを始めるなら安心・安全な取引所で

Copyright ©  -- I'm Standing on the Shoulders of Giants. --  All Rights Reserved
Design by CriCri / Photo by Geralt / powered by NINJA TOOLS / 忍者ブログ / [PR]