I'm Standing on the Shoulders of Giants.

読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。

   
カテゴリー「算数・数学・統計」の記事一覧

ネットとベイズ

グーグルは,スパムやポルノを分類し,関連した言葉や言い回しや文書を見つけるのにもベイズの手法を使っている。きわめて大きなベイジアンネットワークを使って,単語や言い回しの同義語や類語を見つけるのだ。さらにまた,スペルチェッカーに必要な辞書をダウンロードする代わりに,インターネット全体に全文検索をかけて,それぞれの単語がどのように綴られる可能性があるかをすべて洗い出す。こうしてできたのが,「sharon」というのはたぶん「Sharon」のことだろうと認識してタイプミスを直す柔軟なシステムなのである。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.438

ノーベル賞とベイズ

2002年にはベイズが,ノーベル賞を丸々1つとまではいかないものの,一部勝ち取った。2002年のノーベル経済学賞受賞者ダニエル・カーネマンは,ノーベル賞の対象になる前に死去した心理学者のエイモス・トベルスキーとともに,人間が合理的なベイズ推定の手順にしたがって意思決定するわけではないことを示した。調査票の質問に答えるときにはその言い回しに影響されるし,医師たちが癌の患者に手術を行うか放射線治療にするかを決める時も,治療の選択を死亡率と関連付けるかそれとも生存率と関連付けるかで判断が違ってくるのだ。おおかたの人はトベルスキーを哲学的ベイズ派と見ていたが,本人は研究成果を頻度主義的な手法でまとめていた。デューク大学のジェームズ・O・バーガーがトベルスキーになぜかと尋ねると,そのほうが都合がよかったから,という答えが返ってきたという。1970年代にはベイズ派の研究を発表することはきわめて難しかったので,「彼は楽な道を選んだんだ」とバーガーは述べている。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.423

テューキーと世論調査

ベイズ統計を用いたテューキーの世論調査は,当時もっとも人気が高かった2人のテレビキャスターのために国際的な鳴り物入りの宣伝付きで行われていた。したがって,この調査がきっかけでベイズの法則の威力や有効性が広く世に知れ渡り,法則そのものが定期的に補強されていくという展開になる可能性もあった。ところがテューキーがこの調査について語ることも書くことも禁じたために,ほとんどの統計学者が,ベイズの法則がテレビで20年近くもスター並みの役割を演じてきたことを知らずに終わった。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.318

何でも新しい名前

ウォリスの話によると,たとえきちんと確立されたわかりやすい名前があったとしても,「あの人[=テューキー]は,自分がしたことすべてに,何かしら別の名前をつけた」。新たな名前をつければそのアイデアに注目が集まるというので,ある同僚が教えたところ,テューキーは50もの用語を作り出していたという。そのうち定着したものとしては,たとえば線形計画法やANOVA[分散分析]やデータ解析といった用語がある。モステラーはある論文をまとめる際に,シャープやフラットやナチュラルといった音楽の記号を使うのをあきらめるようテューキーを説得するのに苦労したという。さらに別の同僚は,頻度(frequency)ではなく「フンド(quefrency)」だの,分析(analysis)ではなく「プンセキ(alanysis)」だの,「バカ分解(saphe cracking)」といった妙な造語をするんなら,君のことをテューキーでなくJ・W・キューティーと呼ぶぞ,といってテューキーを脅した。ウォリスが言うように「[こういう造語は]必ずしも友達を作ったり人に影響を及ぼす最良の方法ではなかった……それでもテューキーと話すときは,基本的に彼の言葉を使うように心がけた」。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.311

軍と大学

軍がときにはベイズを受け入れたのに対して,大学の統計学者たちは断固としてベイズを受け入れまいとしてきた。この態度の違いが何に由来するのかは,未だによくわからない。軍がこの手法を信用するようになったのは,第二次大戦や冷戦の間に極秘にベイズを使っていたからなのか。それとも,軍がコンピュータを使うことをあまり恐れなかったからなのか。あるいは,軍のほうが強力なコンピュータを使いやすかったというだけのことなのか。第二次大戦や冷戦を巡る情報の多くが今なお機密扱いであることを考えると,これらの謎はこの先も解けずに終わるのかもしれない。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.385

テューキーとベイズ

では,テューキーはどこに立脚していたのだろう。反ベイズ派でしかも反頻度主義者なのだろうか。友人たちによると,テューキーはモステラー同様,融通の利かない統一的な哲学に反対していたという。ブリリンガーの見るところ,テューキーは「ベイズ派の主張そのものではなく……ベイズ派の一部に」いらだっていた。テューキーにいわせると,「ベイズ派の技法をすべて捨ててしまうのは本物の過ちだが,わたしにいわせれば,ベイズ派の技法をありとあらゆるところで使おうとするのはそれ以上に大きな過ちだ」った。つまり,いつどこで使えばいいかを知っているかどうかがポイントだったのだ。テューキーはしばしば「どの場合にも通用するアプローチをつくろうとする自然ではあるが危険な欲望」に不満を漏らし,「わたしの見るところ,ベイズ解析にとって最大の脅威となるのは,重要なものをすべて単一の定量的な枠組みにはめ込むことができるという信念だ」と述べている。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.309-310

テューキーの業績

テューキーは軍事のほかにも,空気の質や化学汚染やオゾン層の減少や酸性雨や,国勢調査の方法論や教育における試験の問題といった広い範囲の問題について政府に助言を行っていた。
 いったい全体どうやって,こんなにたくさんの仕事をこなしたのだろう。セミナーのときに,後ろの列に腰を下ろして居眠りしたり,郵便物を読んだり,新聞にざっと目を通したり,論文に手を入れたりしていたテューキーが,発表が終わったところでおもむろに立ち上がって論評を加えたという類の伝説は山ほどあった。また,レコードでバロックの管楽合奏を聴きながら鉛筆で論文を認め,一番上に「〜とジョン・W・テューキー著」と書き加えたうえで長い付き合いになる2名の秘書のどちらかに渡し,それからおもむろにその論文を完成させるための共著者を探しに行ったという話もある。テューキーは約800の刊行物に名前を残し,105名以上の著者と共同で著作を発表したが,共著者のなかには国立衛生研究所のジェロム・コーンフィールドも含まれており,もっとも頻繁に共著者となったのはハーバード大学での友人フレデリック・モテスラーだった。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.301-302

テューキー

テューキーは,今では「ビット」や「ソフトウェア」という言葉を作った人物として知られているだけで,統計学や工学の業界の外ではほとんど無名に近いが,じつは軍事研究のスパイの世界——とりわけ暗号解読やハイテク兵器の分野で膨大な成果を上げていた。プリンストン大学で統計学の教授を務めながら,30マイル[約50キロ]離れたAT&Tのベル研究所——当時は世界一の工業研究所とされていた——でも仕事をしていた。そしてこのような立場を生かして,5代にわたる大統領,そして国家安全保障局やCIAに助言を行った。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.298

主観主義vs.頻度主義

一方ベイズ派の主観主義者たちは,答えを実際に確率で表したいと考えていた。仮説を受け入れたり却下するだけでは不十分だった。ライファも実感したことだが,事業主にすれば,「それまでの意見に基づいて……また,具体的なサンプル事象に照らして,pが0.25より大きい確率は0.92だと考えられる」というようなことがいえるようになりたかった。
 ところがこれは頻度主義者にとってまさに禁句で,頻度主義者が認めるのは「有意性が0.05レベル」のサンプル事象だけだった。ライファは頻度主義が「分布のごく浅薄な記述を中心に据えている」と見た。「私は学生に(pの分布全体について,また)確かとはいえないpがどのあたりにありそうか(について)確率を使って考えてほしかった。そのうえで意思決定の観点から見て,どのあたりに正しい行動があるのかを解明してほしかった。だから,仮説検定の問題全体が学生をまちがった方向に導くように思われたんだ」

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.266-267

ベイズの復活

1960年代に入ると,まるで雨後の竹の子のようにベイズ派の理論が姿を現しはじめ,ジャック・グッドによると,ざっと勘定したところ地球上の統計学者の総数をはるかに超える「少なくとも4万6656種類の解釈があった」という。主観ベイズに個人論的ベイズ,客観ベイズに経験ベイズ,擬似経験的ベイズに部分的ベイズ,認識様態的ベイズに直観主義的ベイズ,論理的ベイズにファジー・ベイズに階層ベイズ,そしてハイパーパラメトリックなベイズにハイパーパラメトリックでないベイズ等々。これらのバリエーションの多くは,作り出した人間にしかその魅力がわからず,現代の統計学者のなかにも,いくら屁理屈をこねても先駆的なベイズ理論が生まれるわけではないと強く主張する者がいるのは事実だ。ある生物統計学者は,さまざまなベイズ派の理論をどうやって区別するのかと問われて,かすれた声で「汝らはその事後確率によってそれらを見分けるであろう」と答えている[マタイによる福音書7:16「あなたがたは,その実で彼らを見分ける」のもじり]。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.237-238

道化

結局のところ,フィッシャーは道化を演じただけだった。コーンフィールドが冷淡に指摘したように「[批判を受けて]ひっきりなしに仮説が変更されていってまじめに考慮することが難しくなったときに……1つの結論に達した」のである。観察されたデータの関連についての実際的な説明がたった1つしか見つからないのであれば,科学者たちはその原因を見つけたといえるはずだ。これに対して,ほかのやり方でも説明できるのであれば,原因はまだ見つかっていないことになる。コーンフィールドはこうして,その先の喫煙と肺がんの研究のためのロードマップを明らかにしてみせた。
 この時点で,歴史学専攻だったコーンフィールドは,アメリカでもっとも影響力の強い医療統計学者となっていた。1964年にアメリカ軍医総監が,「たばこの喫煙と男性の肺がんとは原因という形で結びついている」と結論したときに引き合いに出されたのはコーンフィールドの業績だった。実験ではない研究が,喫煙と肺がんとの関係を確認するのに役だったのだ。コーンフィールドは,ラプラスが「過去の出来事から得られた,原因の確率と未来の出来事の確率」と呼んだベイズの法則の力を借りて,症例対照研究を通して汚染や暴露と疾病の結びつきの強さを評価することの正当性を理論的に裏付けた。コーンフィールドのおかげで,今や症例対照研究は疫学者が慢性病の原因を突きとめる際の主要なツールとなっている。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.212-213

日本軍の暗号

日本軍の暗号担当は,主要暗号であるJN-25を使うにあたって,メッセージを5桁ずつブロックにして送信した。それぞれのブロックがJN-25のコードブックから引いてきた5桁の数字からなるコードと「添加物」と呼ばれるランダムな5桁の数字を加えたものであることは,イギリスの数学者たちにもわかっていた。したがってイギリスの暗号分析官はこの手順を逆に行えばよいはずだが,肝心のJNコードや添加物が載っているコードブックは手元にない。そこで数学者たちは,まず添加物の5桁の数字と思われるものを絞り込むことにした。そのうえで,暗号の専門家ではない一般人やイギリス海軍婦人部隊からなるチームが標準化された手法で,添加物である可能性がもっとも高い数字を迅速かつ客観的に確認しなければならなかった。特定の添加物が使われているかどうかを判断するには,解読されたコードがその添加物を使って作られている可能性,つまり確率を調べればよい。チームのメンバーは信念の指標として,推測した各コードに,それまでに解読したメッセージにそのコードがどれくらい頻繁に現れたかに応じてベイズ流の確率を割りふった。そのうえで,可能性がいちばん高いブロックや境界線上のブロックや特に重要なブロックをさらに調べていくのだ。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.159

自家製ベイズシステム

チューリングが開発していたのは,自家製のベイズ・システムだった。特定のメッセージを暗号化する際に用いられたエニグマの設定を突きとめるというのは,原因の逆確率の古典的な問題だった。チューリングがどこでベイズの手法を拾ってきたのかは明らかでない。自力で再発見したのか,それともどこかで戦前ケンブリッジ大学で一人孤独にベイズの法則を擁護していたジェフリーズについて聞きかじってそれを取り入れることにしたのか。わかっているのはただ1つ,チューリングもグッドも統計学者ではなく純粋科学者だったから,反ベイズの姿勢にそれほど毒されていなかったということだけだ。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.134

エニグマ

エニグマは,一見,複雑なタイプライターのような形で,通常の26文字分のキーボードと,さらにもう1組,26個の文字が書かれたライトがならんでいる。タイピストが文字のキーを1つ押すと,3枚のホイールを通して電流が流れ,いずれかのホイールが1刻みだけ前に進む。それと同時にランプボード上の暗号化された文字が点灯するので,1人の助手が別の助手にこの文字を読み上げて,得られた無秩序な文字がモールス信号で打電される。メッセージを受けた側は,この手順を逆にたどることになり,暗号を受けた人物がエニグマのキーボードに暗号化された文字を打ち込むと,ランプボードにもともとのメッセージが浮かび上がるというしかけだった。エニグマのオペレータは,配線やホイールや出発点などを変えて,何兆もの組み合わせを作ることができた。
 ドイツ側は,軍の意思伝達の標準手段となる装置をどんどん複雑にしていった。そして約4万個の軍用エニグマを,ドイツ陸軍,海軍,空軍,予備軍,最高司令部,さらにはスペインやイタリアの国粋主義勢力やイタリアの海軍にもばらまいた。1939年9月1日にドイツ軍がポーランドに侵入する際に猛スピードで電撃作戦を展開できたのも,充電器つきエニグマのおかげだった。エニグマを装備した指令車両に将校が乗り込んで,援護射撃や飛行機による急降下爆撃や戦車の動きを調整するという未だかつてない作戦を取ったのだ。ドイツ軍艦のほとんどが——なかでも戦艦や掃海艇や補給船や気象通報船やユーボートは全挺が——エニグマを装備していた。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.123-124

p値

厳密にいうと研究室で働く人々はp値を使うことで,実験で得られた結果からある仮説を反証する統計的に有意な証拠が得られたと言明できる。ただし,そういえるのは(その仮説の下で)その結果(あるいは,もっと極端な結果)が偶然のみによって起きた確率[=p値]がきわめて小さい場合に限られる。
 ジェフリーズは,頻度主義者たちが起きる可能性はあっても実際に起きていない結果についてあれこれ考えるのを見て,じつに奇妙な話だと思った。自分だったら,地震で起きた津波の到達時間に関する情報をもとにして,特定の地震の震央に関する自分の仮説が正しい確率がどれくらいになるのかを知りたいところだが……。なぜ結果でありえたが実際には起きていない事柄を拠り所にして,仮設を捨て去らねばならないのだろう。1つの実験を何度でもランダムに繰り返す——というか,繰り返せる研究者はまれで,これを批判して「架空の反復」と呼ぶ者もいるくらいだった。ベイズ派にとって,データはあくまでも固定された証拠であって変わるはずがない。それに,どこからどう考えてもジェフリーズが特定の地震を繰り返すことは不可能だ。しかもp値はデータに関する言明であって,ジェフリーズが知りたいのは,データを前提とした仮説の正しさに関する言明なのだ。かくしてジェフリーズは,観察されたデータだけに基づいて,その仮説が正しい確率をベイズの法則を用いて計算すべきだと提唱することとなった。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.112-113

答えは「口論」

ネイマン陣営とフィッシャーの追随者たちとの諍いは,1936年には学界全体が注目する事件になっていた。両陣営は,ユニバーシティ・カレッジ・ロンドンの同じ建物の別のフロアに陣取っていたが,決して交わることはなかった。ネイマンのグループはコモンルームで3時半から4時15分まで紅茶を飲み,フィッシャーのグループはそのあとで中国茶をすすった。この2つの陣営は,じつに些細なことでもめた。統計学部の建物には飲み物がなく,日が落ちると黒板が読めなくなるくらい電灯が暗かった。そのうえ暖房もお粗末で,冬になると建物のなかでもオーバーを着るくらいだった。
 両方のグループに縁があったジョージ・ボックス(エゴン・ピアソンに師事し,ベイズ派になり,フィッシャーの娘と結婚した)によると,フィッシャーとネイマンは「ひじょうに意地悪にもなれれば,ひじょうに寛大にもなれた」ネイマンが意思決定に関心を示していたのに対して,フィッシャーは科学的な推定のほうに興味があったので,両者の方法論も応用のタイプも異なっていた。双方ともに自分が扱っている問題にとって最良のことを行っていたにもかかわらず,どちらも相手のしていることを理解しようとしなかった。当時の統計学界には,この状況を表現した有名ななぞなぞがあった。曰く,「統計学者の集団を表す集合名詞は何か」答えは「口論」。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.104-105

光も通らないジャングル

フィッシャーはベイズの法則を激しく非難し,そんなものは「光も通らないジャングル」であって,「誤り,おそらくは,数学界がこれほど深く関わってしまったただ1つの誤りだ」とした。さらに,事前確率を等しいとすることは「とんでもない欺瞞」だと論じ,「わたしには,逆確率の理論がまちがいの上に組み立てられており,丸ごと却下すべきだという確信がある」と高らかに宣言した。学識豊かな統計学者のアンデルス・ハルトはやんわりと,「フィッシャーの傲慢な文体」を嘆いている。フィッシャーの業績にベイズに通じる要素が多々あったにもかかわらず,本人は何十年もベイズと戦って,ついにベイズを立派な統計学者が口にすべきでないタブーにしおおせた。しかも,口論を起こそうという構えを常に崩さなかったから,意見が対立する人間がフィッシャーと議論をするのはかなり困難だった。ベイズ派以外の人からも,フィッシャーは「絶対に敵と合意したくない一心で」自分の立場を決めることがある,と言われるほどだったのだ。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.100

フィッシャーのおかげ

フィッシャーは長い時間をかけて,ランダム化の手法やサンプリング理論,有意性検定や最尤推定,分散分析や実験計画法を作り出していった。フィッシャーのおかげで,それまで統計的な手法を無視してきた実験科学者たちも,プロジェクトを設計する際に統計的な手法を組み込むことができるようになった。フィッシャーはしばしば20世紀統計学の裁判官として,長々と続く議論をたった一言「ランダム化」という評決で締めくくった。1925年には,この新たな技法に関する画期的な手引書『研究者のための統計学的方法』を発表した。独創的な統計処理を門外漢に詳しく説明したこの著書によって,頻度主義は事実上の標準的統計手法となった。最初の手引書は2万部売れ,2冊目はフィッシャーが亡くなる1962年までに7回版を重ねた。さまざまな処置がもたらす効果を分離するためのフィッシャーの分散分析は,自然科学のもっとも重要なツールの1つになった。さらに,フィッシャーが考案した有意性検定やp値は,長い間にしだいに異論が出てはきたものの,何百万回も使われることとなった。今や誰も,フィッシャーが作り出した語彙抜きで統計——フィッシャーのいうところの「観察されたデータへの数学の応用」——を論じることはできない。フィッシャーの着想の多くは,当時の卓上計算機の能力に限界があるために起きた計算上の問題を解決するためのものだった。じきに統計部では,フィッシャー流の計算が1段階終わるごとに機械式計算機が発するベルの音が鳴り響くようになった。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.98-99

いらいら

フィッシャーは,いかなる質問も自分への個人攻撃ととったが,火のついたかんしゃくが破滅のもとになりかねないことは,本人も気がついていた。同僚のウィリアム・クラスカルは,フィッシャーの生涯は「科学を巡る戦いの連続で,科学者の会合や科学論文で一度に複数の戦いを行うことが多かった」と述べている。ベイズ派の理論家ジミー・サヴェッジは,基本的にフィッシャーの仕事ぶりを共感を持ってみていて,「ときとして,聖人でもなければ水に流せないような侮辱を表明することがあった。……フィッシャーは……独創的で正しくて卓越していて有名で尊敬される存在になりたいと,誰よりも強く望んでいた。そして,かなりのレベルでこれらの願いをすべて成し遂げたが,決して心やすらぐことはなかった」と述べている。フィッシャーがいらいらしたのは,ひょっとすると1つには,統計を巡る多くの事柄で自分が正しかったからなのかもしれない。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.96-97

けんか好き

カール・ピアソンは元来けんか好きで,抑えがたい野心を持ち,いかめしくて決然とした人物で,物事に対してあいまいな態度を取ることはまれだったが,ベイズの法則は数少ない例外の1つだった。一様な事前確率や主観性に神秘を尖らせていたのは事実だが,統計学者が使えそうなツールがほかにほとんどなかったために,悲しげに「実際的な人間なら……よりよいツールが登場するまでは,ベイズ—ラプラス印の逆確率の結果を受け入れることになる」と結論した。ケインズが1921年に『確率論』で述べたように,「科学者の目から見れば,これには未だに占星術や錬金術じみたところがあった」さらにその4年後にはアメリカの数学者ジュリアン・L・クーリッジが,これまた「わたしたちはベイズの公式を,今のところ手に入る唯一のものとしてため息混じりに使う」と述べている。

シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.95-96

bitFlyer ビットコインを始めるなら安心・安全な取引所で

Copyright ©  -- I'm Standing on the Shoulders of Giants. --  All Rights Reserved
Design by CriCri / Photo by Geralt / powered by NINJA TOOLS /  /