I'm Standing on the Shoulders of Giants. 算数・数学・統計

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

日本軍の暗号担当は，主要暗号であるJN-25を使うにあたって，メッセージを５桁ずつブロックにして送信した。それぞれのブロックがJN-25のコードブックから引いてきた５桁の数字からなるコードと「添加物」と呼ばれるランダムな５桁の数字を加えたものであることは，イギリスの数学者たちにもわかっていた。したがってイギリスの暗号分析官はこの手順を逆に行えばよいはずだが，肝心のJNコードや添加物が載っているコードブックは手元にない。そこで数学者たちは，まず添加物の５桁の数字と思われるものを絞り込むことにした。そのうえで，暗号の専門家ではない一般人やイギリス海軍婦人部隊からなるチームが標準化された手法で，添加物である可能性がもっとも高い数字を迅速かつ客観的に確認しなければならなかった。特定の添加物が使われているかどうかを判断するには，解読されたコードがその添加物を使って作られている可能性，つまり確率を調べればよい。チームのメンバーは信念の指標として，推測した各コードに，それまでに解読したメッセージにそのコードがどれくらい頻繁に現れたかに応じてベイズ流の確率を割りふった。そのうえで，可能性がいちばん高いブロックや境界線上のブロックや特に重要なブロックをさらに調べていくのだ。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.159

PR

自家製ベイズシステム

チューリングが開発していたのは，自家製のベイズ・システムだった。特定のメッセージを暗号化する際に用いられたエニグマの設定を突きとめるというのは，原因の逆確率の古典的な問題だった。チューリングがどこでベイズの手法を拾ってきたのかは明らかでない。自力で再発見したのか，それともどこかで戦前ケンブリッジ大学で一人孤独にベイズの法則を擁護していたジェフリーズについて聞きかじってそれを取り入れることにしたのか。わかっているのはただ１つ，チューリングもグッドも統計学者ではなく純粋科学者だったから，反ベイズの姿勢にそれほど毒されていなかったということだけだ。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.134

エニグマ

エニグマは，一見，複雑なタイプライターのような形で，通常の２６文字分のキーボードと，さらにもう１組，２６個の文字が書かれたライトがならんでいる。タイピストが文字のキーを１つ押すと，３枚のホイールを通して電流が流れ，いずれかのホイールが１刻みだけ前に進む。それと同時にランプボード上の暗号化された文字が点灯するので，１人の助手が別の助手にこの文字を読み上げて，得られた無秩序な文字がモールス信号で打電される。メッセージを受けた側は，この手順を逆にたどることになり，暗号を受けた人物がエニグマのキーボードに暗号化された文字を打ち込むと，ランプボードにもともとのメッセージが浮かび上がるというしかけだった。エニグマのオペレータは，配線やホイールや出発点などを変えて，何兆もの組み合わせを作ることができた。
　ドイツ側は，軍の意思伝達の標準手段となる装置をどんどん複雑にしていった。そして約４万個の軍用エニグマを，ドイツ陸軍，海軍，空軍，予備軍，最高司令部，さらにはスペインやイタリアの国粋主義勢力やイタリアの海軍にもばらまいた。１９３９年９月１日にドイツ軍がポーランドに侵入する際に猛スピードで電撃作戦を展開できたのも，充電器つきエニグマのおかげだった。エニグマを装備した指令車両に将校が乗り込んで，援護射撃や飛行機による急降下爆撃や戦車の動きを調整するという未だかつてない作戦を取ったのだ。ドイツ軍艦のほとんどが——なかでも戦艦や掃海艇や補給船や気象通報船やユーボートは全挺が——エニグマを装備していた。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.123-124

ｐ値

厳密にいうと研究室で働く人々はｐ値を使うことで，実験で得られた結果からある仮説を反証する統計的に有意な証拠が得られたと言明できる。ただし，そういえるのは（その仮説の下で）その結果（あるいは，もっと極端な結果）が偶然のみによって起きた確率[＝ｐ値]がきわめて小さい場合に限られる。
　ジェフリーズは，頻度主義者たちが起きる可能性はあっても実際に起きていない結果についてあれこれ考えるのを見て，じつに奇妙な話だと思った。自分だったら，地震で起きた津波の到達時間に関する情報をもとにして，特定の地震の震央に関する自分の仮説が正しい確率がどれくらいになるのかを知りたいところだが……。なぜ結果でありえたが実際には起きていない事柄を拠り所にして，仮設を捨て去らねばならないのだろう。１つの実験を何度でもランダムに繰り返す——というか，繰り返せる研究者はまれで，これを批判して「架空の反復」と呼ぶ者もいるくらいだった。ベイズ派にとって，データはあくまでも固定された証拠であって変わるはずがない。それに，どこからどう考えてもジェフリーズが特定の地震を繰り返すことは不可能だ。しかもｐ値はデータに関する言明であって，ジェフリーズが知りたいのは，データを前提とした仮説の正しさに関する言明なのだ。かくしてジェフリーズは，観察されたデータだけに基づいて，その仮説が正しい確率をベイズの法則を用いて計算すべきだと提唱することとなった。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.112-113

答えは「口論」

ネイマン陣営とフィッシャーの追随者たちとの諍いは，1936年には学界全体が注目する事件になっていた。両陣営は，ユニバーシティ・カレッジ・ロンドンの同じ建物の別のフロアに陣取っていたが，決して交わることはなかった。ネイマンのグループはコモンルームで３時半から４時１５分まで紅茶を飲み，フィッシャーのグループはそのあとで中国茶をすすった。この２つの陣営は，じつに些細なことでもめた。統計学部の建物には飲み物がなく，日が落ちると黒板が読めなくなるくらい電灯が暗かった。そのうえ暖房もお粗末で，冬になると建物のなかでもオーバーを着るくらいだった。
　両方のグループに縁があったジョージ・ボックス（エゴン・ピアソンに師事し，ベイズ派になり，フィッシャーの娘と結婚した）によると，フィッシャーとネイマンは「ひじょうに意地悪にもなれれば，ひじょうに寛大にもなれた」ネイマンが意思決定に関心を示していたのに対して，フィッシャーは科学的な推定のほうに興味があったので，両者の方法論も応用のタイプも異なっていた。双方ともに自分が扱っている問題にとって最良のことを行っていたにもかかわらず，どちらも相手のしていることを理解しようとしなかった。当時の統計学界には，この状況を表現した有名ななぞなぞがあった。曰く，「統計学者の集団を表す集合名詞は何か」答えは「口論」。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.104-105

光も通らないジャングル

フィッシャーはベイズの法則を激しく非難し，そんなものは「光も通らないジャングル」であって，「誤り，おそらくは，数学界がこれほど深く関わってしまったただ１つの誤りだ」とした。さらに，事前確率を等しいとすることは「とんでもない欺瞞」だと論じ，「わたしには，逆確率の理論がまちがいの上に組み立てられており，丸ごと却下すべきだという確信がある」と高らかに宣言した。学識豊かな統計学者のアンデルス・ハルトはやんわりと，「フィッシャーの傲慢な文体」を嘆いている。フィッシャーの業績にベイズに通じる要素が多々あったにもかかわらず，本人は何十年もベイズと戦って，ついにベイズを立派な統計学者が口にすべきでないタブーにしおおせた。しかも，口論を起こそうという構えを常に崩さなかったから，意見が対立する人間がフィッシャーと議論をするのはかなり困難だった。ベイズ派以外の人からも，フィッシャーは「絶対に敵と合意したくない一心で」自分の立場を決めることがある，と言われるほどだったのだ。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.100

フィッシャーのおかげ

フィッシャーは長い時間をかけて，ランダム化の手法やサンプリング理論，有意性検定や最尤推定，分散分析や実験計画法を作り出していった。フィッシャーのおかげで，それまで統計的な手法を無視してきた実験科学者たちも，プロジェクトを設計する際に統計的な手法を組み込むことができるようになった。フィッシャーはしばしば２０世紀統計学の裁判官として，長々と続く議論をたった一言「ランダム化」という評決で締めくくった。１９２５年には，この新たな技法に関する画期的な手引書『研究者のための統計学的方法』を発表した。独創的な統計処理を門外漢に詳しく説明したこの著書によって，頻度主義は事実上の標準的統計手法となった。最初の手引書は２万部売れ，２冊目はフィッシャーが亡くなる１９６２年までに７回版を重ねた。さまざまな処置がもたらす効果を分離するためのフィッシャーの分散分析は，自然科学のもっとも重要なツールの１つになった。さらに，フィッシャーが考案した有意性検定やｐ値は，長い間にしだいに異論が出てはきたものの，何百万回も使われることとなった。今や誰も，フィッシャーが作り出した語彙抜きで統計——フィッシャーのいうところの「観察されたデータへの数学の応用」——を論じることはできない。フィッシャーの着想の多くは，当時の卓上計算機の能力に限界があるために起きた計算上の問題を解決するためのものだった。じきに統計部では，フィッシャー流の計算が１段階終わるごとに機械式計算機が発するベルの音が鳴り響くようになった。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.98-99

いらいら

フィッシャーは，いかなる質問も自分への個人攻撃ととったが，火のついたかんしゃくが破滅のもとになりかねないことは，本人も気がついていた。同僚のウィリアム・クラスカルは，フィッシャーの生涯は「科学を巡る戦いの連続で，科学者の会合や科学論文で一度に複数の戦いを行うことが多かった」と述べている。ベイズ派の理論家ジミー・サヴェッジは，基本的にフィッシャーの仕事ぶりを共感を持ってみていて，「ときとして，聖人でもなければ水に流せないような侮辱を表明することがあった。……フィッシャーは……独創的で正しくて卓越していて有名で尊敬される存在になりたいと，誰よりも強く望んでいた。そして，かなりのレベルでこれらの願いをすべて成し遂げたが，決して心やすらぐことはなかった」と述べている。フィッシャーがいらいらしたのは，ひょっとすると１つには，統計を巡る多くの事柄で自分が正しかったからなのかもしれない。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.96-97

けんか好き

カール・ピアソンは元来けんか好きで，抑えがたい野心を持ち，いかめしくて決然とした人物で，物事に対してあいまいな態度を取ることはまれだったが，ベイズの法則は数少ない例外の１つだった。一様な事前確率や主観性に神秘を尖らせていたのは事実だが，統計学者が使えそうなツールがほかにほとんどなかったために，悲しげに「実際的な人間なら……よりよいツールが登場するまでは，ベイズ—ラプラス印の逆確率の結果を受け入れることになる」と結論した。ケインズが１９２１年に『確率論』で述べたように，「科学者の目から見れば，これには未だに占星術や錬金術じみたところがあった」さらにその４年後にはアメリカの数学者ジュリアン・L・クーリッジが，これまた「わたしたちはベイズの公式を，今のところ手に入る唯一のものとしてため息混じりに使う」と述べている。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.95-96

すべてラプラシアン

１７８１年には，ラプラスはベイズの法則という名前以外のこの法則のすべてを手中に収めていた。この法則の定式も方法論も見事な活用も，すべてピエール・シモン・ラプラスが成し遂げたものだった。確率に基づく統計がごくふつうに使われるようになったのも，ラプラスのおかげだった。賭け事の理論を実際的な数学に変えたラプラスの業績は，以後１００年にわたって確率と統計の世界を支配することになる。ラトガー大学のグレン・シェイファーは，「思うに，すべてを成し遂げたのはラプラスであって，わたしたちがあとからそれをトーマス・ベイズの中に読み取っているだけのことなのだろう。ラプラスはこの法則を近代的な言葉で表現した。ある意味で，すべてがラプラシアンなのだ」と述べている。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.70-71

神の名は

１８０２年にマルメゾンにある皇后ジョセフィーヌのバラ園で開かれた園遊会で，教皇との和解を考えていたナポレオン皇帝はラプラスに，神や天文学や天体を巡る有名な議論をふっかけた。
　「それで，これらすべてを作ったのは誰なのだ」とナポレオンは尋ねた。
　ラプラスは落ち着いて，天体系を維持しているのは，一連の自然な原因である，と答えた。
　するとナポレオンは不満げに，「ニュートンは著書の中で神に言及している。貴殿の著作を熟読してみたが，一度の神の名が出てこないのはなぜなのだ」と尋ねた。
　これに対してラプラスは，重々しく答えた。「わたくしにはそのような仮説は必要ございませんので」

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.67-68

ラプラス

原因の確率の理論を最初に考えだしたのは確かにベイズだが，ラプラスが独力でラプラス版の原因の確率の理論を発見したことははっきりしている。ベイズ—プライスの小論が発表されたとき，ラプラスはまだ１５歳だった。しかもこの小論は，イギリスの上流階級を読者対象とする英語の雑誌に発表されただけで，以後一度も話題にならなかったらしい。そのため絶えず海外の雑誌に目配りしていたフランスの科学者たちですら，ラプラスが一番乗りだと考えて，その独創性を心から褒め称えた。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.53-54

中心極限定理

ラプラスはアカデミーで朗読された論文で，まずこの新たな原因の確率の理論を２つの賭博の問題に適用した。どちらの場合も，結果そのものは直感的にわかったのだが，数学的な証明は行き詰まった。１つ目の例では，壺に黒と白の切符が入っているが，白と黒の比（原因）はわからないとした。そこから切符を何枚か引いて，その結果に基づいて次の切符が白である確率を求めたい。ラプラスはその答えを何とか数学的に証明しようと，四つ折り判４ページにわたって少なくとも４５本の式を書き連ねたが，どうもしっくりこなかった。
　２つ目の例は，運と技術の両方を要求されるピケットというゲームの問題だった。２人ではじめたゲームを途中で中止した場合に，２人の相対的な技量（原因）を評価して場の掛け金を配分するにはいったいどうすればよいか。またしても，答えは直感的にわかったが，数学的に証明することはできなかった。
　大嫌いな賭博の問題を片付けると，ラプラスは嬉々として，天文学者たちが実際に仕事で直面している重要な科学の問題に取りかかった。同一の現象を巡って異なる観測が得られたとき，それらをどのように取り扱えばよいのか。当時の科学における３つの大きな問題として，地球の引力が月の動きに及ぼす影響についての問題，木星と土星の動きについての問題，地球の形に関する問題があった。観測者たちが，たとえ同じ場所でまったく同じ装置で同時に測定を繰り返したとしても，毎回わずかに結果が異なる可能性があった。このような矛盾した観測結果かから中央値を算出するにあたって，ラプラスは観測値が３つの場合に限定して論を進めたが，それでもこの問題を定式化するには，７ページにわたって延々と式を書き連ねなければならなかった。科学的にいって，３つのデータの平均を取ればよいことまではわかったのだが，それが数学的に裏付けられたのは１８１０年のことだった。この年にようやく，原因の確率を使うことなく，中心極限定理が打ち立てられたのである。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.52-53

部分修正

ベイズは，事前の直感に基づく判断と反復可能な実験に基づく確率を組み合わせた。そして，ベイズ派の特徴ともいうべき手法を作り出した。当初の考えを客観的な新情報に基づいて部分修正する，という手法である。これなら，まわりの世界について観察したことから，その原因になりそうなものへとさかのぼることができる。かくしてベイズは長い間探し求められていた確率の聖杯——後の数学者たちが原因の確率，逆確率の原理，ベイズ統計，あるいはシンプルにベイズの法則と呼ぶもの——を発見した。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.36

メモに挟まれていた

ベイズの着想はロイヤル・ソサエティーの仲間内で議論されたが，本人は自分の着想が正しいと思っていなかったらしく，ロイヤル・ソサエティーに論文を送って発表するでもなく，ほかの書類に紛れたままで１０年ほどほったらかしにしていた。ベイズがこの大発見をしたのが１７４０年代の終わり——おそらくヒュームの小論が発表された１７４８年のすぐあと——だろうと結論できるのも，この論文が１７４６年から１７４９年までのメモの間に突っ込まれていたからにすぎない。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.33

一言でいうと

ベイズのシステムは，概念としては単純だ。客観的な情報を得て自分の意見を変えるだけのことで，つまり「当初の考え（最初のボールが落ちた場所に関する推測）＋最近得られた客観的なデータ（直近のボールが最初のボールの左側に落ちたか右側に落ちたか）＝より正確な新たな考え」，と表すことができる。やがて，この手法の各部分には名前がつけられ，当初情報がない時点で考えた確率を「事前確率」，観察された客観データに基づく仮説の確率を「尤度」，客観データによって更新された確率を「事後確率」と呼ぶようになった。このシステムを使って再計算をする場合には，すでに得られている事後確率が次回の事前確率になる。これは進化するシステムで，新たな情報が加わるたびに確信へと近づいていく。一言でいうと，

　事後確率は，事前確率と尤度の積に比例する

のである（もっと専門的な統計学者の用語では，尤度というのは観察されてすでに値が定まっているデータを前提とした競合する仮説の確率を示す。だが，南アフリカで統計の歴史を研究しているアンドリュー・デールによれば，「いささか乱暴な言い方をすれば，尤度とは，ベイズの定理を巡る議論から事前確率を取り除いたときに残るものである」こうなると，ことはかなり単純だ）。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.29-30

ビリヤードテーブル

ベイズは逆確率問題の本質を明確に把握したうえで，問題の出来事がこれまでに何度起きたか，あるいは起きなかったかといった過去の事実だけがわかっているときに，その出来事が今後起きる確率がどれくらいかを近似することを目標とした。問題を定量的に扱うには数値が必要だ。ベイズは1746年から1749年のどこかの時点で，この問題のすばらしい解決法を思いついた。出発点として，とりあえず何らかの数値——ベイズがいうところの「推測値」——をでっち上げておいて，情報が得られた時点でその数値を修正すればよい。
　次にベイズは，１８世紀版コンピュータ・シミュレーションともいうべき思考実験を行った。余計な条件をすべて取り去った基本的な問題として，まず１つの正方形のテーブルを想定する。テーブルは完璧に水平で，投げたボールがとまる確率はどの点もすべて全く同じだとする。後の世の人々は，ベイズはビリヤード・テーブルを想定したとしているが，非国教徒の聖職者たるベイズがビリヤード・ゲームに賛成したとは思えない。しかもこの思考実験では，ボールがテーブルの縁にあたって跳ね返ったり，ほかのボールにぶつかったりはしない。つまりテーブルの上をでたらめに転がったボールがどこかで止まる確率はすべて等しいと考えるのだ。
　ではここで，テーブルに背を向けて座るベイズの姿を思い浮かべよう。この状態では，テーブルの上がどうなっているかはまるでわからない。ベイズは，１枚の紙にテーブルの表面を表す正方形を描く。そして，架空のテーブルにこれまた架空のまん丸なボールを投げるところを想像する。ただし，テーブルに背を向けているので，ボールがどこに落ちたのかはわからない。
　次に，ベイズが誰かに，ボールをもう１つテーブルに投げて，そのボールが最初のボールよりも右に落ちたのか左に落ちたのかを教えてくれ，と頼んだとしよう。このとき，左という答えが返ってくれば，最初のボールはどちらかというとテーブルの右側にある可能性が高いといえる。逆に右という答えが返ってくれば，最初のボールがテーブルのうんと右寄りにある確率は可能性は低いと考えられる。
　このような手順を踏んで，次から次へとボールを投げてもらう。当時のばくち打ちや数学者たちはすでに，投げるコインの数が多ければ多いほど，得られる結論の信頼性が増すことを知っていた。そしてベイズは，投げるボールの数を増やしていくと，新たに得られる情報の断片が積み重なって，最初に投げたボールが落ちたと思われる場所の範囲が狭められていくことに気がついた。

シャロン・バーチュ・マグレイン　冨永星（訳）　(2013).　異端の統計学　ベイズ　草思社　pp.27-28

個人誤差の発生原因

新しい研究室で私がはじめに行ったのも，個人誤差がどのように発生するかというものでした。人によって測定値が異なり，しかも正しい測定を行う人と，たえずおかしな測定をする人とがいるというのが分かるまでには，かなりの時間を要しました。基本は，真の値が分からないところで，人は正しい値を探して，どのように測定をするかということでした。
　このような人による差が，何によって発生するかというのは，あるいは人間の本質を研究する上での，根本的な問題になるかもしれないという気がするのです。当時は心理学者のすすめもあり，これを人の性格について調べてみました。現在では，性格テスト以上に，測定者の能力を調べた方が，いろいろなことが分かるような気もしています。
　内向的で情緒安定型の人は，かなりの割合で測定がうまく，逆に，外向的で情緒不安定型の人には，測定の下手な人が多いということが分かりました。性格的な傾向ですから，訓練で測定がうまくなるというのは，根本的には，あまり期待できないことになります。
　内向的で情緒安定型というのは，いわれた仕事は真面目にするが，自分からは外部に対して積極的には働きかけない人，いわゆる技能者に向く人のようです。このような人たちが，測定という地味な仕事を支えているということになります。
　外向的で情緒不安定型というのは，経営者とか政治家，ジャーナリストなど，自分から積極的に仕事をする人の性格傾向のようです。このような人は，測定などという地味な仕事になど，かまってはいられないという人たちでしょう。

矢野宏　(1994).　誤差を科学する：どこまで測っても不正確！？　講談社　pp.153-154

条件の固定化

普通に考えると，ものごとの正しさを判断する場合には，条件を精密におさえる方がよいというようにいわれます。血圧にしても，朝目覚めたとき，まだ布団の中で起き上がらないときに測った血圧が基準となるといわれます。これは条件を固定した方が，より信頼のおけるデータがとれるであろうということです。このことはそれなりに正しいと思います。
　しかし，実際に変化するものを調べる場合，条件を固定してしまうと，かえって全体の傾向がつかめなくなるときがあります。ある程度の変化を与えて，その変化にどれだけ追随するかを調べるのも新しい方法なのです。

矢野宏　(1994).　誤差を科学する：どこまで測っても不正確！？　講談社　pp.87

現実の方がおかしい

誤差というのは本来，あってはならないもの，あるいはあっては欲しくないものということであるとすれば，現実を理想化，あるいは美化したものの見方をこそ真実と考える情動が働いて，事実でないものの方が，事実以上の重みを持ってしまうということになるかも知れません。
　それは現実の社会の人間関係だけでなく，技術の世界も同じことなのです。現実にあるはずの誤差を無視して，誤差のない状態でものを考え，現実と矛盾すると，自分の考えの方がおかしいと思わずに，現実の方がおかしいと考えるのです。

矢野宏　(1994).　誤差を科学する：どこまで測っても不正確！？　講談社　pp.31-32

I'm Standing on the Shoulders of Giants.