忍者ブログ

I'm Standing on the Shoulders of Giants.

読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。

   
カテゴリー「算数・数学・統計」の記事一覧

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

おおよその値の把握

 社会統計を解釈するときには,物事の規模を大雑把にでもつかんでおくのが役に立つ。ベンチマークとなる数字をほんのいくつか知っておくだけで,何らかの数字に出会ったときに,それについて評価を下すための予備知識をもつことができる。たとえば米国社会について考えるとき,次のことを知っておくと役に立つ。

・米国の人口は3億をいくらか超えている。(2006年10月にこの大台に乗ったときの大騒ぎをご記憶かもしれない。)
・米国では毎年およそ400万人の赤ちゃんが生まれる。(2004年には,411万2052人)。これは,とくに子どもや若者について考えるとき,意外に役に立つ情報だ。1年生は何人いるか。約400万人。18歳未満の米国人は何人いるか。およそ400万×18,つまり7200万人。子どもは男女がおおよそ同数なので,10歳の女の子は200万人くらいだと計算できる。
・毎年およそ240万人の米国人が死ぬ。(2004年には239万7615件の死亡が記録されている)。4人に1人ちょっとが心臓病で死ぬ。(2004年には27.2%)。がんで死ぬ人もほぼ同じくらいだ。だから,心臓病で死ぬ人と,がんで死ぬ人を合わせると半分ちょっとである。(2004年には120万6374人,つまり50.3%)。これとくらべて,盛んに報道される死因のなかには,ずっとまれなものがある。たとえば交通事故で死んだ人は2004年にはおよそ4万3000人,乳がんは4万人,自殺は3万2000人,殺人は1万7000人,HIVは1万6000人だ。つまり,今あげた死因のそれぞれが占める割合は,死因全体の1%か2%である。
・人種と民族をめぐる統計は厄介だ。こうしたカテゴリーの意味が明確でないからである。しかし一般に,自分を黒人とかアフリカ系米国人と認識する人々は人口の13%弱——およそ8人に1人を占めている。(全人口が3億人を超えていることを思い起こせば,米国の黒人はおよそ4000万人いると計算できる。3億÷8=3750万だ)。自分をヒスパニックあるいはラティーノと認識する人はもう少し多い——14%を超えている。つまりおよそ7人に1人だ。だが人々を人種的あるいは民族的カテゴリーにきれいに分けることはできない。おおかたの政府統計はヒスパニックを人種的カテゴリーというより民族的カテゴリーとして扱っている。というのも,ヒスパニックは,自分の属する人種について,人によって考えが異なるかもしれないからだ。たとえば2007年に国勢調査局は,ある報道発表資料で,今や「マイノリティー(少数集団)」が米国の人口の3分の1を占めていると発表したが,そこで,「非ヒスパニックで単一人種の白人は総人口の66%」という言い方をした。ごたごたした言い回しに注意していただきたい。「非ヒスパニック」という言い方が用いられているのは,自分の民族性をヒスパニックに分類する人のなかに,自分の人種を白人とする人がいるからだし,「単一人種」は,祖先にいろいろな人種がいる(たとえば祖先にアメリカインディアンがいるなど)と申告する人がいるからだ。要するに,自らを白人と考えているのに,国勢調査局によってマイノリティーしゅうだんに分類されている人がいるのである。人々を人種と民族に分類するための唯一の権威ある方法などないのだ。それでも,米国の人口の民族的,人種的構成を大雑把にでもつかんでおけば役に立つことがある。

ジョエル・ベスト 林 大(訳) (2011). あやしい統計フィールドガイド 白楊社 pp.19-22
PR

未熟な論理

 未熟な論理の「悪い例」で私のお気に入りは,1989年8月22日に,ニューヨーク・タイムズの科学別冊,『サイエンス・タイムズ』に掲載された,ネコについての記事だ。記事にはこうある。「専門家は,ネコのよく知られた生存能力に関して,驚くべき証拠を発見した。今回の発見は,この時期ネコが高層ビルの窓から落ちやすい,ニューヨーク市内という特殊な環境下でのことだ。研究者たちはこの現象を,ネコ高層症候群と呼んでいる」。
 私の興味を引いたのは,どのようにしてネコが落下しても生き延びたかという解説だった。それによると,「たとえば,1984年6月4日から11月4日までのあいだに,132匹のネコが落下により動物医療センターに収容された。……そのうちほとんどが,コンクリートの上に落ちた。ほとんどが生き延びた。専門家たちはネコが生き延びた原因は,物理的な法則や,優れたバランス感覚,そしてムササビ術とでも呼ぶべきものだろうとしている」。
 「(獣医師たちは)132匹のうち129匹が何階から落ちたのか記録している。2階から32階までのあいだで,……うち17匹が飼い主によって処分されたが,その理由の大半はケガが致命的だったからではなく,治療費が払えなかったからだ。残りの115匹のうち,8匹がショックと胸のケガで死亡した」。
 「もっと驚くべきことは,落下距離が長いほど,生存率が上がっているということだ。7階以上から落ちたネコ22匹のうち死んだのは1匹だけで,9階以上から落ちた13匹のネコのうち骨折したのは1匹だけだった。32階からコンクリートの上に落ちたネコ,サブリナは,肺にわずかな穴があき,歯が欠けただけだった」。
 「なぜ,高層階のネコのほうが下層階のネコよりも生存率が高いのだろうか?1つの説明として考えられるのは,落下スピードはある速さに達したらそれ以上増えない,というものだ(獣医師たちが言うには),……ネコの場合,その「終端速度」に速く到達する。ネコの終端速度は時速60マイルで,人間の大人の終端速度は時速120マイルだ。2人の獣医師が推測するに,終端速度に達するまでのあいだ,ネコはスピードの増加に対して反射的に足を突っ張り,それによってケガをしやすくなる。しかし,終端速度に達するとネコはリラックスし,足をムササビのように広げ,その結果空気抵抗が高まり,衝撃を均等に分散させられるようになる」。なるほどと思い,私はこの記事をとっておいた。
 その後しばらくして読者から,「なぜネコは,高い場所から落ちても脚で着地できるのか,説明してください」との投書が来た。私は,コラムに先の研究を引用して次のように書いた。「驚くべきことに,長い距離を落ちたネコの方が生存率が高かったのです。7階以上から落ちたネコ22匹のうち21匹が生き延びました。9階以上から落ちた13匹はすべて生き延びました。32階からコンクリートに落ちたサブリナは,肺に小さな穴が開いたのと歯が欠けただけで済みました。彼女はその日,山盛りのツナをもらったんでしょうね」。
 後になってそのコラムを読み返してみたとき,その統計が気になったが,理由はわからなかった。一度も,元の記事に載っていた文言を,詳しく吟味してみようとはしなかったのだ。だから,私がやっと気がづいたのは,アシスタントがこの記事に関するたくさんの手紙を,私の机まで持ってきたときだった。最初の手紙は,ニューヨーク州ブルックリンのパメラ・マークスからだった。「私の2匹のネコは別々にテラスから落ちましたが,残念なことに2匹とも死んでしまいました。1匹は10階から落ち,もう1匹は14階から落ちました。私はこれらの事故を医療機関に報告しませんでしたし,ほかの人たちもネコの死を報告したりしないでしょう。私の2匹のネコをあなたの統計に加えて,9階以上から落ちた15匹のネコのうち,少なくとも2匹が死んだと言ってください」。この時点で,私の間違いは明らかになった。どうして最初に,この点を見逃したのかわからない。

マリリン・ヴォス・サヴァント 東方雅美(訳) (2002). 気がつかなかった数字の罠:論理思考力トレーニング法 中央経済社 pp.95-96

標本サイズ

 検定力に関わる3つのパラメータ,すなわち効果量,標本サイズ,有意水準のなかで,研究者が能動的に関与できるものが1つだけあります。それは標本サイズです。効果量はそれ自体が検討の対象ですから,どのようになるかはわかりません。そもそもはじめから効果量がどいのくらいかわかっているなら,研究をする必要がありません。もちろん,先行研究から期待されるおおよその効果量のサイズはあるかもしれません。しかし,実際にデータをとらなければわからないからこそ研究をするのです。また,有意水準は,繰り返し述べているように,心理学では慣習的に5%で固定されています。効果量は測定してみなければわからない,有意水準は固定で動かせない,だからこそ,標本サイズだけが研究者が能動的に動かせる唯一のパラメータとなります。

大久保街亜・岡田謙介 (2012). 伝えるための心理統計:効果量・信頼区間・検定力 勁草書房 pp.153

過誤

 どんな判断にも,第1種の過誤と第2種の過誤をおかしてしまう可能性があります。ネットオークションで最安値だと判断し入札したら,実は相場と変わらなかった,こんな経験は誰にでもあると思います。逆に,相場と変わりなく安値感がないと思っていたのに,よく調べたらものすごくお買い得だった。そんなこともあるでしょう。前者の例は差があると判断したのに(最安値だと思ったのに)違ったので,第1種の過誤です。一方,後者の例は,差がないと判断したのに(相場の値段と変わらないと判断したのに)差があった(お買い得だった)ので,第2種の過誤になります。
 有意水準だけに注目する帰無仮説検定では,第2種の過誤についてほとんど情報が得られません。有意水準は第1種の過誤が生ずる確率であり,帰無仮説検定では,それだけをコントロールするからです。第2種の過誤の確率は直接コントロールできません。しかし,上の日常的な例からも分かるように,何かの判断をするなら,第1種の過誤と第2種の過誤のどちらもが生じうるのです。

大久保街亜・岡田謙介 (2012). 伝えるための心理統計:効果量・信頼区間・検定力 勁草書房 pp.150-151

効果量の意味

また,当然ながら効果量の大きさが持つ意味は,分野によっても変わってきます。たとえば生死に関わるような領域においては,小さな効果量でも大きな意味を持つことが想像できます。Vacha-Hasse & Thompson (2004)は,喫煙の有無が寿命に与える効果量は,η2 = .02前後であるという例を挙げています。この値は効果量としては小さな値ですが,変数である「寿命」が価値の高いものであり,またこの程度の効果量が多くの研究によって繰り返し報告されているため,たとえ効果は小さくとも重要な結果と考えられるでしょう。このように,効果量の値が持つ意味の解釈は,先行研究や関連する研究の知見を参照しながら,最終的には分析者自身が頭を使って行う必要があります。

大久保街亜・岡田謙介 (2012). 伝えるための心理統計:効果量・信頼区間・検定力 勁草書房 pp.96

有意傾向

 たとえばp < .1を指して,有意傾向と表現することがあります。このような表現は,帰無仮説検定に,本来は存在しません。ある有意水準を基準として,結果に意味があるか否かを,デジタルにズバッと分けてしまうのが帰無仮説検定なのです。帰無仮説検定に基づくなら,有意傾向などと言わずに「10%水準で有意」と言うべきです(もっとも,有意水準を10%に設定することを他の研究者が認めてくれるかは別問題です)。
 もちろん先ほど述べたように,p = .049とp = .051の間でなにか決定的な差があると考える人は,現実的にはほとんどいないので,有意傾向という表現が使われるのでしょう。しかし,帰無仮説検定の規則に従えば,そのような表現は存在しません。デジタルな2分法こそが,帰無仮説検定の本筋だからです。帰無仮説検定の極端な2分法を皮肉り,Rosnow & Rosenthal (1989)は,「神はp < .06をp < .05と等しく,そして同じくらい強く愛してくださる(p.1277)」と述べたくらいです。

大久保街亜・岡田謙介 (2012). 伝えるための心理統計:効果量・信頼区間・検定力 勁草書房 pp.35

ゴルトンの指紋研究

 この1888年の講演以来,指紋への関心を深めたゴルトンは,自らの運営するサウス・ケンジントンの人体測定研究所において,指紋のサンプルの収集を始める。1890年までにおよそ2500人から指紋の提供を受けたゴルトンは,試行錯誤を重ねた結果,「容易に認識できるいくつかの差異」に基づいて分類するのが,もっとも実用的なやり方であるとの結論に至る。こうしてゴルトンは,すべての指紋を「弓状紋(arches)」「蹄状紋(loops)」「渦状紋(whorls)」のいずれかに分類する方法を提案する。今日においても指紋の分類の基本であり続けているこの3分類をゴルトンが着想するにあたっては,1823年の論文において指紋を9つに分類していた,チェコの生理学者プルキンエ(Jan Evangelista Purkyne, 1787-1869)の見解に負うところが大きかったと考えられる。
 だがゴルトンはこの3分類法を,人体測定法に代わる身元確認の手段とするつもりはなく,むしろベルティヨン法の補助手段とすることを考えていたようである。1888年の講演でゴルトンが指摘したように,ベルティヨン法による分類では犯罪記録の集合に十分なばらつきが得られないとするなら,そこに指紋による分類を付け加えれば,身元の確認はより一層容易になるだろう。「A.ベルティヨンのそれのような手法の実際的な有効性は,指紋を考慮に入れることによって,さらに高まる余地があるのである」。しかしそれは逆に言えば,すべての犯罪記録を分類するためには,指紋だけでは不十分であるということを,ゴルトン自身も認めていたということでもある。1892年にゴルトンは,指紋を専門的に扱った世界初の書物となる『指紋(Finger Prints)』を刊行するが,この記念すべき書物においてもゴルトンは,ベルティヨン法が約2万人の集合にまで対処できるのに対し,指紋法が対処できるのはおよそ500人であるとするなど,控え目な態度を守っている。その上でゴルトンは,ベルティヨン法に指紋を組み合わせれば,2万×500すなわち1000万の集合にも対処できるようになるとして,指紋法を人体測定法の補助として用いるべきであるとする主張を,再び繰り返すのだ。

橋本一径 (2010). 指紋論:心霊主義から生体認証まで 青土社 pp.119-120

分類指標としての身体

そもそも人体測定法は,分類の指標として優れているとは言えないのではないか。このような根本的な疑問をイギリスから投げかけてきたのが,フランシス・ゴールトン(Francis Galton, 1822-1911)だった。1888年5月,王立科学研究所において「人の身元確認と特徴記述」と題する講演を行なったゴルトンは,ベルティヨンによる人体測定法の原理を説明しながら,人体のサイズに基づく分類では,十分なばらつきが得られないと指摘する。たとえば足の大きい人間は,手の指も長いことが多いだろう。したがって足の大きさに関して,「大」「中」「小」の3分類のうちの「大」に分類された者の多くは,指の長さについても「大」に分類されることになり,計測箇所を増やしたとしても,結局は一部の分類ばかりに偏りが出ることになってしまう。つまり「身体の計測値は,相互に依存しすぎている」のである。では計測値以外に,個人を特定するのに適した特徴は存在するのだろうか。「微妙な点」にこそ,そうした特徴があるのだとするゴルトンが,「おそらくもっとも美しく,特徴的」だとして紹介するのが,「手のひらや足の裏に,きわめて複雑に,しかし規則的な秩序で並んでいる(中略)小さな溝」,すなわち指紋に他ならなかった。

橋本一径 (2010). 指紋論:心霊主義から生体認証まで 青土社 pp.117-118

擬似相関

 あなたは信じないかもしれないが,アメリカ国民を見る限り,靴のサイズと一般常識のあいだには高い相関がある。小さいサイズの靴を佩いている人に比べると,大きいサイズの靴を履いている人のほうが歴史や地理の知識が豊富なのだ。かといって,大きな靴を買えば賢くなるわけではない。いや,脚が大きいからと言って賢いわけでもない。じつは,たくさんの相関がそうであるように,この相関は思うほど重要なものではない。なぜなら,私たちは相関と因果関係を混同しがちだからである。私が述べたばかりの相関は真実だが,ここではある要素が別の要素を引き起こしているという,私たちがついついしてしまいがちな判断は間違いである。靴のサイズの例で相関が見られる理由は,小さな足(したがって小さな靴)を持つ人はこの地球の新しい住人,すなわち乳幼児で,まだ歴史の勉強をするには幼過ぎるだけなのだ。私たちは成長するに連れて学ぶが,成長そのものが学習につながるわけではない。

ゲアリー・マーカス 鍛原多恵子(訳) (2009). 脳はあり合わせの材料から生まれた:それでもヒトの「アタマ」がうまく機能するわけ 早川書房 pp.241

条件付き確率

 次のページに,面白いグラフがある。これは,年収のレベル(ヨコ軸)と,既婚か独身か(タテ軸)で切ってみて,それぞれの面積の広さで人数の比率が一目でわかるという便利場グラフである。ここでは,30〜34歳の男性のデータを拾ってみた。
 右の端のほうには,600万円以上,800万円以上の高年収,さらには右端にはわずかながら1000万円以上の人たちもたしかに存在する。ここまでは想像どおりであろう。
 が,既婚か独身かで既婚に色を着けてみると,右のほうはほとんどが既婚となっていることもわかる。1000万円以上の人たちで見ると(そもそも30代前半で年収1000万円を稼ぐ人は少ないので0.7%しかいないが),その8割はすでに結婚しているのである。
 なので,30代前半で1000万円以上稼ぎ尚且独身である男性は,
 0.7×0.2=0.14%しか残っていないのだ。
 30〜34歳の独身男性は数字としては大勢いる。が,実はそれは200〜400万円,あるいは200万円以下のゾーンに偏って存在しているのだ。
 この方たちは残念ながら,女性がよく言う結婚相手としての「普通」ではないのかもしれない。しかし,人数のボリュームで言うと,むしろ過半数,すなわち「普通」なのである。
 こうなると,これら「普通」の男性は入り口段階で結婚の対象から外されてしまう人が多くなる。

西口 敦 (2011). 普通のダンナがなぜ見つからない? 文藝春秋 pp.26-27

議論の果てに

 1940年までに研究所は100万回近い試験を実施し(それをテレパシーと呼ぶか否かは別としても),どう見ても普通ではない結果を出してみせた。実験が適切に設計され,きちんと管理されて実施されたとする。そのうえで彼らの出した結論を否定すれば,同様の統計学的手法,たとえば何百万もの人々が使っている薬の安全性を保証するために製薬会社が用いている手法の結果を否定することにもなる。デューク大学の科学者たちは,実験の管理とデザインに対する批判にすべて対応したうえで,彼らがテレパシーと呼ぶ効果について有効な証拠を収集することに成功したのだ。
 この結果を受理できなかった心理学者たちに残された道は「彼らはまちがいを犯したにちがいない」と言い続けることだけだった。こうした批判者たちは統計学を最低限しか理解していなかったので,まず統計を攻撃の的とした。しかし追試の多くが失敗したのは,ラインの実験の100分の1,1000分の1,ときには1万分の1しか実施しなかったからなのだ。そして1937年の末には,,統計学者たちはもう議論は十分だと考えるようになる。
 1937年12月,数理統計研究所の所長バートン・H・キャンプ博士が,超心理学研究所の研究結果の統計面について声明を発表した。「ライン博士の研究は,ふたつの側面からなっている。実験と統計である。実験面については,数学者は当然ながら何も申しあげることはない。しかし統計面について言えば,近年の数学研究は,実験が適切になされたと仮定した場合,その統計的分析は有効であるとの結論に達している。ライン博士の研究が的確に批判されるとすれば,それは数学的背景に関連しない部分であるべきだ」

ステイシー・ホーン ナカイサヤカ(訳) 石川幹人(監修) (2011). 超常現象を科学にした男:J.B.ラインの挑戦 紀伊國屋書店 pp.87-88

入試の予測的妥当性

 一般入試の問題は,基本的にその大学の教員が作問しています。入学後に落ちこぼれず,授業についていけるかどうかを測るために,必要となる学力を試験で問う。これが,入試の目的だと思います。
 だとしたら,理想的な入試問題というのは,「受験時に高得点を取った学生ほど,卒業時に,4年間の授業で好成績を残している」問題だということになります。もちろん,入学後に各自がどのような成長を果たすかは完全にはわかりませんが,おおむね受験時の成績が,入学後の成績に比例するような問題が作れたら,試験としては理想的でしょう。
 もっと言えば,こうした観点がないまま入試問題が作られているとしたら,それは何かがおかしいのです。なにしろ一斉に入試問題を解かせて,点数が高い順に合格を出しているのですから。「点数が高い者ほど,よりわが大学で学ぶ資質がある」ということでなければ,学力測定ツールとしての,一般入試の存在意義は揺らいでしまいます。

倉部史記 (2011). 文学部がなくなる日 主婦の友社 pp.136-137

主成分分析

 データキューブから情報を抽出する最も基本的な手順は,“主成分分析”だとロジャーは言った。それぞれの波長で撮られた画像の数値に重みづけをして重ねあわせ,コンピュータにひと組の画像を作りあげてもらう。この新しい画像は,互いに近いピクセルの数値の差の大きさをもとにしたものだ。結果は色のパターンではなく,差異のパターンとして現れる。新しい組の最初の画像は,ちがいのある部分のコントラストが最も大きい個所を強調している。二番目の画像はつぎに大きいところを,三番目の画像はそのまたつぎに大きいところを強調したものだ。この過程により,最初は同じ部分を異なる波長の光で撮影したひと組の画像だったものが,最終的には光の波長を重ね合わせて画像中の異なる対象を映しだしたものに変わる。
 このパリンプセストでは明らかに,第1主成分は最もコントラストの強い画像の特徴,すなわち祈祷書の文章を表す。周囲の薄茶色の羊皮紙から際立って見える黒のインクで書かれているからだ。しかし,第2主成分は下に書かれていたアルキメデスのテキストがほとんどである。とはいえ,別の主成分画像はカビを映しだすかもしれない。成分を析出することができたら,数字を操作して思いどおりに明るさを調整すればいい。

リヴィエル・ネッツ,ウィリアム・ノエル 吉田晋治(監訳) (2008). 解読!アルキメデス写本:羊皮紙から甦った天才数学者 光文社 pp.292-293

トリミングとクッキング

 19世紀の科学者たちの間で支配的だったデータへの思慮に欠ける態度について,1830年,コンピュータの前身である計算機の発明者チャールズ・バベジは,論文を著している。彼は『英国科学の衰退についての考察』の中で,多くの欺瞞のさまざまなタイプを分類し,「中でも“トリミング”というのは,平均値から大きなほうへずれている観測値のところどころを少しずつ削り取り,それらを小さすぎる観測値に付け加えることである」とも述べている。実証はしていないが,バベジは,時にはトリミングは,他のタイプの欺瞞よりも非難されにくいことをつきとめ,次のように述べている。「ご都合主義者の観測から与えられる平均値は,トリミングされようがされまいが同じであるからだ。トリミングの目的は,観測値の絶対的精密さへの評価を得ることにある。しかし,真理の尊重や,それに対する慎重な配慮によって,自然から得られる事実を完全にねじ曲げはしないものである」。
 バベジによれば,トリミングよりも悪質なのは彼が“クッキング”と呼ぶものであり,今日では選択的報告として知られている行為だった。「クッキングはさまざまな形態からなり,その目的は極めて高い正確さを装った外見や性質を通常の観測値に与えることである。そのための数多くある方法の1つは,多数の観測値をつくり出し,それらの中から合致するか,きわめて近似の値を選択するものだ。もし100の観測が行われたとして,その中から満足なものが15か20しか選び出せない場合は,その料理人には不運なことに違いない」。

ウイリアム・ブロード,ニコラス・ウェイド 牧野賢治(訳) (2006). 背信の科学者たち:論文捏造,データ改ざんはなぜ繰り返されるのか 講談社 pp.47-48

輸入量が減れば自給率は上がる

 ほとんどの国民が,「自給率が上がる=国内総生産が増える」ものだと解釈しているのではないか。ところが実際は,国産が増えようが減ろうがほとんど関係ない。自給率を上げようと思えば,分母に占める割合の大きい輸入が減れば済む。国産が増えなくても,毒ギョーザ事件などの外的要因によって輸入が減少すれば,自給率は自然と高まるのである。
 もしも日本の国際的な経済力が弱まり,海外での食料調達に買い負けすればするほど,何もしなくても自給率だけがどんどん高まっていく。だが本当にそのような地体が訪れれば,国民が入手できる食料は減り,摂取できるカロリーは減少する。
 発展途上国は軒並み自給率が高いが,それは海外から食料を買うお金がないからだ。貧困にあえぎ,栄養失調に苦しむ国民が多いにもかかわらず,自給率だけが高い。

浅川芳裕 (2010). 日本は世界5位の農業大国:大嘘だらけの食料自給率 講談社 pp.32

ランダムであるということ

 ある連続的な事象を想像してみよう。その事象は四半期ごとの収益でもよいし,インターネット・デートサービスが提示した一群の吉日と凶日でもよい。いずれの場合も,その連続が長ければ長いほど,あるいは,目にする連続的事象が多ければ多いほど,パターンが見えてくる確率は大きくなる。その結果,一連のよい四半期,悪い四半期,あるいは吉日,凶日は,まったく「原因」を必要としない。
 その要点をはっきり例示したのが数学者,ジョージ・スペンサー=ブラウンだった。彼は0と1がランダムに10の100万7乗(10^1000007)個並んだ数列には,0が連続して100万個並んでいる箇所が,少なくとも個別に10箇所は存在するはずだと書いた。ある科学的な目的のために乱数を使おうとしていたら,その種の一連の数に出くわした哀れな人間を想像してみよう。彼のコンピュータのソフトは,0を連続的に5個,その後10個,その後20個,1000個,10000個,10万個,50万個,生成した。彼がそのソフトを返品し,金を返してもらうことは,はたして不当か?また,新しく買った乱数表の本をぱらぱらめくると,出てくる数字は「0」ばかり。科学者はそれに対してどう反応するだろうか?スペンサー=ブラウンが示した要点は,プロセスがランダムであることと,ランダムに見えるプロセスを生成することとは違う,ということだった。
 実際アップル社は,音楽プレーヤーiPodで最初に採用したランダム・シャッフリングの方法で,その問題にぶつかった。というのは,真のランダムネスはときどき繰り返しを生み出すが,同じ歌が同じアーティストによって繰り返し演奏されるのを聴いたiPodユーザーが,シャッフルはランダムではないと思ったからだ。そこで「もっとランダムな感じにするために少しランダムではなくした」と,アップル社の創業者スティーヴ・ジョブスは言った。

レナード・ムロディナウ 田中三彦(訳) (2009). たまたま:日常に潜む「偶然」を科学する ダイヤモンド社 pp.258-259
(Mlodinow, L. (2008). The Drunkard’s Walk: How Randomness Rules Our Lives. New York: Pantheon.)

狂気のゲーム

 もう1つ,狂気のゲームを紹介しておこう。カリフォルニア州がその市民につぎのような提示をしたとしよう。1ドルまたは2ドル払った者のうち,ほとんどの者は何ももらえないが,1人は大金を手にし,1人は暴力的な方法で死刑にされる。はたしてこんなゲームに申込む者がいるだろうか?それがいるのだ。それも意気込んで。「州の宝くじ」と呼ばれているのがそれだ。
 もちろんいま私が書いたような形で州がそれを宣伝しているわけではないが,実際にものごとはそのように運んでいる。というのも,1人の幸運な人間がゲームごとに大金を手にする一方,何百万というほかの競合者が券を買うために車で各地の発券所に向かったり,そこから戻ったりする際,途中で何人かが事故で死んでいるからだ。米国道路交通安全局の統計データを使い,それぞれの人間がどのぐらい遠くまで車を運転し,券を何枚買い,何人の人間が典型的な事故に巻き込まれるかといった前提を立てると,そうした不慮の死に対する合理的な評価は,1回の宝くじでおよそ1人が死ぬ,ということになる。

レナード・ムロディナウ 田中三彦(訳) (2009). たまたま:日常に潜む「偶然」を科学する ダイヤモンド社 p.118
(Mlodinow, L. (2008). The Drunkard’s Walk: How Randomness Rules Our Lives. New York: Pantheon.)

モンティ・ホール問題のポイント

 モンティ・ホール問題が理解しづらいのは,注意深く考えないと,母親の役割同様,司会者の役割が正しく認識されないからだ。しかしゲームを動かしているのは司会者なのだ。ドアが3枚ではなくつぎのように100枚あると仮定すると,司会者の役割が明確になるかもしれない。あなたはやはりドア1を選択するとしよう。ただし,今度の場合それが正解である確率は100分の1だ。一方,残り99枚のドアのうちの1つにマセラティがある確率は100分の99である。前の場合と同様,ここで司会者は,あなたが選択しなかった99枚のドアのうちの1枚を除き,すべてを開く。その際,もしその中にマセラティを隠しているドアがあれば,それを開かないように司会者は十分注意している。
 さて,司会者がそれをし終えたあとも,あなたが選んだドアの背後にマセラティがある確率は100分の1のままだし,残りのドアのうちの1つの背後にマセラティがある確率もやはり100分の99のままだ。しかしいまや司会者が介入したことで,他の99枚のドアすべてを代表するたった1枚のドアが残っている。だから,その残されたドアの背後にマセラティがある確率はじつに100分の99だ!

レナード・ムロディナウ 田中三彦(訳) (2009). たまたま:日常に潜む「偶然」を科学する ダイヤモンド社 pp.86-87
(Mlodinow, L. (2008). The Drunkard’s Walk: How Randomness Rules Our Lives. New York: Pantheon.)

引用者注:モンティ・ホール問題
テレビのゲーム番組で,競技者が3つのドアの選択権を与えられるとします。1つのドアの後ろには車が,残りのドアの後ろにはヤギがいます。競技者が1つのドアを選択したあと,すべてのドアの後ろに何があるかを知っている司会者が,選ばれなかった2つのドアのうちの1つを開けます。そして競技者にこう言います。「開いていないもう1つのドアに選択を変えますか?」選択を変更することは競技者にとって得策でしょうか?

答えは?

 われわれはマリリン・ヴォス・サヴァントを賞賛しなければならない。なぜなら,彼女は初歩的な確率の問題に対する大衆の理解を高めようとしているだけでなく,挫折感を抱かせるようなあのモンティ・ホール問題を経験してからも,そうした問題を書きつづける勇気をもっているからだ。ここでの話を終える前に,彼女のコラムからとったもう1つ別の問題を取り上げておこう。これは1996年3月のものだ。

 これは父がラジオで聞いた話です。デューク大学で2人の学生が学期間中ずっと化学でAの成績をとっていました。ところが学期末試験の前夜に彼らは別の州でパーティをしていて,デューク大学に戻ったのは期末試験が終わってからでした。タイヤが1つパンクしたというのが担当教授に対する2人の弁解で,再試験をしてもらえないかを教授に尋ねました。教授はそれに同意し,試験問題を書き,2人を別々の部屋に入れて試験を受けさせました。問題用紙の表に書かれていた最初の問題は5点満点の問題でした。ついで問題を裏返すと,2問目は95点満点の問題で,「パンクしたのはどのタイヤだったか?」という問題でした。2人の学生が同じ答えを書く確率はいくらだったでしょうか。父と私は16分の1だと考えています。それで正しいですか?

 いや,そうではない。もし2人の学生が嘘をついていたのであれば,彼らが同じ答えを書く正しい確率は4分の1である。

レナード・ムロディナウ 田中三彦(訳) (2009). たまたま:日常に潜む「偶然」を科学する ダイヤモンド社 pp.82-83
(Mlodinow, L. (2008). The Drunkard’s Walk: How Randomness Rules Our Lives. New York: Pantheon.)

2人とも女である確率は?

 この双子の問題では普通つぎのような追加の質問がなされる。<2人のうち1人が女だとすれば,2人とも女である確率はいくらか?>。この問いに対して以下のように推理する人がいるかもしれない。2人のうち1人が女なのだから,目を向けるべきは残る1人,その子が女である確率は50パーセントだから,2人とも女である確率は50パーセントである,と。
 これは正しくない。なぜだろうか。問題文は1人が女だとしているが,<どの>1人かを言ってはいない。このことが状況を変える。混乱するかもしれないが,それはそれで結構。なぜなら,それがカルダーノの手法のパワーを示す格好の例であるからだ。カルダーノの手法が推論の仕方を明確にしてくれる。
 その新しい情報——2人のうち1人が女,という情報——は,2人とも男であるという可能性をわれわれが考慮しないでよいことを意味している。だからカルダーノの手法を使うとき,<男,男>という可能な結果が標本空間から除外される。そして標本空間には3つだけ,可能な結果が残る。<女,男>,<男,女>,<女,女>だ。これらのうちの<女,女>だけが好ましい結果——つまり,2人とも女という結果——だから,その各率は3分の1,あるいは33パーセントである。これで,問題文が<どの>1人が女であるかを特定しなかったことが,なぜ問題なのかを理解できると思う。たとえばその問題が,<最初に生まれてくる子が女だと仮定すれば>2人とも女である確率はいくらか,を尋ねていたとるれば,<男,男>と<男,女>が標本空間から除外されていただろうから,各率は2分の1,あるいは50パーセントということになっただろう。

レナード・ムロディナウ 田中三彦(訳) (2009). たまたま:日常に潜む「偶然」を科学する ダイヤモンド社 p.82
(Mlodinow, L. (2008). The Drunkard’s Walk: How Randomness Rules Our Lives. New York: Pantheon.)

bitFlyer ビットコインを始めるなら安心・安全な取引所で

Copyright ©  -- I'm Standing on the Shoulders of Giants. --  All Rights Reserved
Design by CriCri / Photo by Geralt / powered by NINJA TOOLS / 忍者ブログ / [PR]