忍者ブログ

I'm Standing on the Shoulders of Giants.

読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。

   
カテゴリー「算数・数学・統計」の記事一覧

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

尺度が有意味である条件

 一般に「尺度」が有意味であるためには,ある条件をみたすことが必要である.直観的に述べると,「ある測定値」あるいは「測定値間の関係」が特定の数値表現にのみ依存するものは有意味ではなく,特定の数値表現にだけ依存するものではないものが有意味と考えられる.例えば,「A氏の身長が180である」という命題は,有意味ではない.これは,測定単位が指定されていないので,この命題の真偽の判定は,ある特定の数値表現(cm単位か,m単位かなど)に依存するからである.「A氏の身長が180cmである」という命題は,cm単位とm単位などの他の身長を計測する尺度の数値表現間の換算が明確であるかぎりにおいて,有意味である.
 また,「今日の東京と大阪の最高気温の比が1.01であった」という命題は,有意味ではない.これは,最高気温をどういう測定尺度の単位で測るかによって,この比の値は変化するからである.最初の例の「180」は測定の次元(長さというdimension)と単位をもつべき数値であるが,次の例の「1.01」は測定値間の関係を表し,また無次元であることに注意する(比の分母と分子が同じ次元をもつのでキャンセルされ,比自体は次元をもたない).

吉野諒三・千野直仁・山岸侯彦 (2007). 数理心理学 心理表現の理論と実際 培風館 p.76
PR

尺度 scale

 (i) 測定対象全体に適正に数値を対応させる規則(数値表現,ものさし,ruler)の集合の特定.
 (ii) そのような規則と規則の間の関係の明確化.

 Stevensは,(i)のような「規則(ものさし)の集合」を尺度(scale)と呼んだ.ここで十分な注意が必要なのは,「適正な数値表現を与える規則の集合」が,(i)により,その存在定理が証明され,(ii)により一意性定理が証明されたもとで,「尺度」とよばれるのであって,個々の数値表現を与える規則(ものさし,ruler)は尺度の表現または代表(a representation)となることである.したがって,例えば,キログラム単位系は,それ自体が尺度なのではなく,重さの尺度の「1つの表現(ものさし)」,または重さの尺度を代表しているものなのであって,その背景には,比例定数倍で互いに変換できる他の重さの表現のすべての集合(通常用いられているポンド単位系などに限らず,例えばキログラム単位系に正の比例定数倍で得られるすべての単位系の集合)があると考えるのである.日常では,このような認識は薄いかも知れないが,この点を誤解すると,一見問題のないような測定や統計分析において誤謬やパラドックスを生じることもある.

吉野諒三・千野直仁・山岸侯彦 (2007). 数理心理学 心理表現の理論と実際 培風館 p.60


相関と因果関係

 相関関係がいかに強くてもそれがそのまま因果関係とはならないことを,たいていの人は知っている。ところがこの事実は容易に忘れられる。傘を携えることと雨とは強い相関関係があるが,傘を携えているからといって雨が降るわけではないことを誰でも承知しているのに,脳の中の何らかの生物学的マーカーと精神障害の間に相関関係があることが発見されると,このマーカーを障害の原因だと信じ込むという落とし穴に容易にはまってしまう。脳がすべての精神的な経験において中心的役割を担っていることが知られていることがその1つの理由なのだろうが,論理的には,この関係は傘と雨の関係と変わりがない。人の精神状態や経験は脳に影響を与えうるし,逆もありうる。2つの事柄に相関関係があるとき,どちらが原因でどちらが結果であるか,自分でわかっているつもりになってはいけない。「原因」と「影響」が混同されやすい。また,2つのものに因果関係がなくても,大きな相関関係はありうる。たとえば,ほとんどの国で,名前が母音で終わる人は名前が子音で終わる人より,平均でみると,背が低い傾向が見られる。しかし少し考えてみればわかるように,最後の母音子音と背の高さに因果関係を想定すべき道理はない(注)。

(注)なぜ母音で終わる人のほうが背が低いかわかるだろうか?

エリオット・S・ヴァレンスタイン 功刀 浩(監訳)・中塚公子(訳) (2008). 精神疾患は脳の病気か? 向精神薬の科学と虚構 みすず書房 pp.167

偶然を越える証拠はあるか

 バフェットは,1984年の講演で,アメリカの2億1500万人の人々がすべて1対1に分かれ,コイントスの結果に1ドルを賭けることを想像してみるよう,聴衆に求めた。外した人は失格で,当たった相手に1ドルを渡して終了となる。
 翌日,勝った人だけがまた2人1組に分かれ,同じゲームをするが,今度は賭け金を2ドルにする。負けたら失格で,その日の勝者は4ドルを手にすることになる。このゲームを毎日1回,賭け金を倍にして続ける。20回はじいた後では,200人ほどが勝ち残っていて,それぞれが100万ドル以上を手にしている。
 バフェットによれば,その中の誰かが,自分の取った方法について『毎朝30秒働くだけで,20日で100万ドル稼ぐ方法』という本を書くだろうという。「そんなことはできない」と言う象牙の塔の経済学者に,「できないのなら,どうしてこの200人がいるのか」としつこく問いつめる人もいるだろう。「するとビジネススクールの教授の中には無粋な人がいて,おそらくこんな事実を持ち出すだろう。2億1500万頭のオランウータンが同じことをしても,同じ結果になる----200頭ほどのがめついオランウータンが20連勝している」
 どんな証拠があれば,われわれは相場に勝つほどうまく株を選べる人がいることを納得するはずだと言えるのだろう。毎年,星いくつの評価が出て,相場や他の人々よりもずっと好成績を出した投資信託会社や人を特定している。そうした会社や人のうち,何年にもわたって上位にとどまる人はほんのわずかだけだ。そうした会社の広告を見れば,この赫々たる記録からすると,その予測力はさらに続くという印象をしっかりと残してくれる(細かい字で書かれていることは無視すれば)。しかし,バフェットの話からうかがえるように,長期的に立派な成績を挙げる非常に運のいい少数の会社やマネジャーの集団は,必ず出ることになっている。

ウィリアム・パウンドストーン 松浦俊輔(訳) (2006). 天才数学者はこう賭ける 誰も語らなかった株とギャンブルの話 青土社 pp.236-237.

リスクは幾何平均で見よ

 そう言えば「平均」には2種類あることを学校で習ったなと思い出すかもしれない。算術平均は,ごく普通の平均だ。並んだ値をすべて足し合わせ,並んだ数値の個数で割れば得られる。たとえば野球の打率はこれであり[四死球と犠打を除く打席について,安打なら1,凡打なら0として計算したときの平均],表計算ソフトのエクセルで,=AVERAGE()という式を入れたときに計算するものだ。
 幾何平均は,高校で習うが,たいていの人は忘れてしまう。これは n 個並んだ数を掛けて,その積の n 乗根をとる。もちろん,今ではどちらの平均にしても,手計算をする人はいない。エクセルにも,幾何平均を計算する式がある。 =GEOMEAN()である。
 いずれの平均でも,その要点は,話を簡単にすることにある。マニー・ラミレスの打率は.349であるという方が,そのプロ野球での打撃の実績すべてよりおぼえやすい。打率は,膨大なままのデータを並べたものよりも,選手の能力について教えてくれることも多い。
 野球でも他の多くのことでも,通常の,算術平均で十分に間に合う。なぜわざわざ幾何平均など考えるのだろう。
 ベルヌーイは,ギャンブルから話を始める。「公平な」賭けとは,生じる可能性が同等の結果について算術平均として計算される期待値が,ゼロとなるものだ。いわゆる公平な賭けと言われる例をひとつ挙げよう。硬貨をはじいた結果に,財産をすべて賭ける。同じ額の全財産を掛けた相手と勝負する。2倍になるかゼロか,いずれかだ。勝った方が,相手の家も車も貯金も,すべて取る。
 自分はたとえば10万ドルを持っているとしよう。硬貨をはじいた後は,20万ドルになるか,ゼロか,いずれかで,その可能性は五分五分だ。算術平均は,(200000+0)/2で,10万ドルとなる。10万ドルを,この賭けの公平かつ適切な価値だとして採用すれば,この賭けをしてもしなくても変わらないはずだ。今10万ドルあって,硬貨をはじいた後も,期待値は同じ額である。変わりはない。
 人はこういうふうには考えない。自分も相手も,こんな賭けに応じるほど馬鹿ではない。自分の持っている物をすべて没収されれば,総額が2倍になって得られる得よりも,はるかに大きい損をしなければならない。
 幾何平均を見よう。可能性が等しい2通りの結果を掛け算----200000×0----して,その結果の平方根を取る。何にゼロを掛けようと,ゼロになってしまうので,幾何平均もゼロとなる。これこそが賭けの本当の価値だと思えば,今ある10万ドルを手放さない方を選ぶだろう。


ウィリアム・パウンドストーン 松浦俊輔(訳) (2006). 天才数学者はこう賭ける 誰も語らなかった株とギャンブルの話 青土社 pp.236-237.

ありえなさ

 またしても,ゴルディロックス帯の場合と同じく,設計仮説の代案となる人間原理的な仮説は統計的なものである。ここで科学者が頼みにするのが,とんでもなく大きな数字の魔術だ。私たちの銀河では,10億から300億のあいだの惑星が存在すると推定されており,全宇宙にはおよそ1000億の銀河が存在する。通常そうするように用心のためにゼロをいくつか減らして,10億×10億という,宇宙にありうる惑星の数としては控え目な推計をしておこう。さて,生命の起源,DNAに相当するものの自然発生的な誕生が,本当は,まったくたまげるほどにありえない出来事であったと仮定してみてほしい。つまり,10億の惑星のうちでたった1つでしか起こらないほどありえないものだと考えるのだ。どんな科学者であれ,自分の申請している研究が成功する確率は100分の1でることを認めれば,研究助成金給付団体に笑われてしまうだろう。しかし私たちはここで10億分の1という掛け率の話をしているのである。それでも……そんなにべらぼうに低い掛け率であってさえ,10億もの惑星上で生命が誕生してることになるのだが---もちろん,地球はその1つである。
 もう一度言いたいが,この結論は非常に驚くべきものである。もし,生命が惑星上で自然発生的に誕生する掛け率が10億対1であるとすれば,それにもかかわらず,その唖然とするほどありえない出来事が,それでも10億もの惑星で起こっているだろうというのだ。そうした10億の生命をもつ惑星のうちどれか1つを見つけだせる確率は,と考えると,干し草の山の中から1本の針を探すという諺を思い出す。しかし私たちは針を見つけに出かけていかなければならないということはない。なぜなら(人間原理に戻れば),探索能力があるほどのいかなる存在も必然的に,探索を始めるそれより前に,そうした,とてつもなく稀な針のうちの1本の上にいなければならないからである。

リチャード・ドーキンス 垂水雄二(訳) (2007). 神は妄想である 宗教との決別 早川書房 pp206-207.

相関の解釈

 相関係数を計算するのは容易だが,その解釈の間違いに悩まされてきた。次にその例を示そう。いま成長期にある1人の子どもの腕の長さと足の長さとの関係をプロットしたとしよう。2つの興味深い意味のある高い相関が得られるだろう。第1は,私がやった単純化である。私は2次元(足の長さと腕の長さ)から始め,それを1次元に効果的に還元させた。この例では相関が非常に強力なので,この(1次元の)直線は,もともと2次元として考えられたほぼ全ての情報を表していると言えよう。第2は,この場合,1次元へ還元したことの原因について合理的な推論をなしうることである。腕の長さと足の長さとは,しっかりと関連しあっている。なぜなら,いずれも,根底にある生命現象,すなわち成長の部分的測定値だからである。
 しかし,相関は原因を明白に特定するための魔法の方法だなどと,期待しすぎないためにも,ここで,私の年齢と過去10年間のガソリンの値段との関係を取り上げてみよう。この場合には,相関は完全なものに近い。しかし,原因については誰も何も指摘できないであろう。相関という事実は原因に関しては何も示さないのである。強い相関が弱い相関よりもその原因をよく表すなどと考えるのは正しくない。私の年齢とガソリンの値段との相関は,ほぼ1.0である。先に腕の長さと足の長さの場合には原因に言及したが,それは相関が高いからではなく,これらについての生物学上の知識をもっていたからである。原因については単なる相関の事実からではなく,他のところから推論されなければならない(しかしながら,我々は原因を求めてはならないということを銘記しているならば,思いもよらない相関が我々を原因究明へと導いてくれるかもしれない)。この世界に見られる相関関係のほとんどには因果関係がない。過去数年感,減少し続けているものならいかなるものでも,地球とハレー彗星間の距離(これも最近は減少し続けている(原書出版時点の話であり,現在ではこの距離は増加しつつある))と強い相関を示すであろう。しかし,最も先進的な占星家でさえ,これらの間に因果関係があるとは認めないだろう。相関が原因を暗示するという根拠のない仮定は,おそらく人間の論理的思考のうち2つないし3つの最も重大で最も一般的な誤りに入る。


スティーヴン・J・グールド 鈴木善次・森脇靖子(訳) (2008). 人間の測りまちがい 下 差別の科学史 河出書房新社 pp.96-97.

小説家のサルに投資するか

 無限大匹のサルを(頑丈な)タイプライターの前に座らせて好きに叩かせると,『イーリアス』を正確に書き上げるサルが確実に一匹は出る。でも,調べてみると,一見して思うほどには面白い話ではないのがわかる。そんなことになる確率はとても低いからだ。この話をもう一歩進めてみよう。これでどのサルが英雄かはもうわかったわけだ。では,そのサルが次に『オデュッセイア』を書く方に賭ける人はいるだろうか?
 この思考実験で面白いのは二歩目のほうだ。過去のパフォーマンス(この例では『イーリアス』を書き上げた実績)は将来のパフォーマンスとどれくらい関係あるのだろうか?過去の実績にもとづき,過去の時系列データの特徴に頼って将来を予測するなら,どんな判断を下すときでも同じことが当てはまる。さっきのサルが,あなたの家を訪ねてきて,すばらしい実績をあなたに吹き込んだとしたら,どんなことになるだろう?だってほら,『イーリアス』を書き上げたんだから。

ナシーム・ニコラス・タレブ 望月 衛(訳) (2008). まぐれ 投資家はなぜ,運を実力と勘違いするのか ダイヤモンド社 p.170.

スキューズ数

 リトルウッドの発見から20年ほど後の1933年,リトルウッドの下にいた大学院生スタンリー・スキューズが,素数を少なくとも10の10乗の10乗の34乗まで数え上げれば,ガウスの評価が素数の個数を下回る現場を目に出来るだろう,と発表した。実にとてつもない数である。大きな数は,観察可能な宇宙の原子の数と比較されることが多い。。かなり正確な見積もりによると,観察可能な宇宙にある原子の総数はほぼ10^78だという。だが,スキューズがあげた数はこの数をはるかに超えている。やがてハーディは,スキューズ数とよばれるこの数が昭明の中で現れた最大の数だと断言することになる。

マーカス・デュ・ソートイ 冨永星(訳) 素数の音楽 新潮社 p.195.


数学はピラミッドのような存在

 他の分野でなら,ある世界像が何十年か後には崩れ去っているということもありうる。しかし数学では,証明のおかげで,たとえば素数に関する事実は,将来なにが見つかろうと決して変わらないと100パーセント保証されている。数学は,いわばピラミッドのような存在で,それぞれの世代は前の世代の業績の上に立ち,足下が崩れる心配などなしに業績を積み上げていくことができる。数学者にとって,この頑強さが魅力なのだ。古代ギリシャ人の打ち立てた業績が今でも正しいといえる科学の分野は,数学以外にない。事物は火と空気と水と土からできているというギリシャ人の信念をあるいは鼻で笑う人もいるだろう。そして未来人たちが,メンデレーエフの元素周期表を,同じように鼻で笑うことにならないとは限らない。しかし数学者はいつの時代も,数学教育の第一歩として,素数について古代ギリシャ人が証明したことを学ぶのである。

マーカス・デュ・ソートイ 冨永星(訳) 素数の音楽 新潮社 pp.54-55.


あのガウスですら騙された

 数学者はいわば証明にとりつかれていて,推論を支える証拠が実験で得られたくらいでは満足しない。このような姿勢に対して,科学の他の分野から驚嘆の声が上がることも多いが,時にはあざけりの声も聞こえてくる。ゴールドバッハの予想は,2001年現在400,000,000,000,000(400兆)までのすべての数について成り立つことが確認されているが,それでも定理としては認められていない。これが数学以外の分野なら,これほど圧倒的な数値データが得られれば,納得できる主張として喜んで受け入れ,ほかのことに関心を移すはずだ。後になって新たな証拠が見つかり,数学の規範を再評価しなければならなくなったとしても,それはそれでかまわないではないか。科学の他の分野にとって十分なことが,なぜ数学にとっては不十分なのか。
 たいがいの数学者は,このような反論を考えただけで震え上がるはずだ。フランスの数学者アンドレ・ヴェイユがいうように,「人間にモラルが不可欠であるように,数学には厳格さが必要不可欠」なのだ。なぜ厳格さが不可欠かというと,ひとつには,数学では証拠の評価がしばしば非常に難しいからだ。数学の中でもとりわけ素数は,なかなかその真の姿をはっきりさせようとはしない。ガウスは素数に関してある予測を行い,それを裏付ける圧倒的なデータが得られたことから,この予測が正しいと考えた。ところが後に理論的に分析したところ,実は間違っていたのである。あのガウスですら騙された。第一印象が正しいとは限らないから,証明が必要なのだ。科学の他の分野では,ほんとうに信頼できるのは実験で得られた証拠だ,という態度が支配的だが,数学の場合は,いかなる数値データも証明なしには信用すべからず,という姿勢が染みついている。


マーカス・デュ・ソートイ 冨永星(訳) 素数の音楽 新潮社 pp.53-54.


計算と情報の切り捨て

 計算をすると,その過程で情報が捨てられる。取り返しのつかない不可逆のことが実際におきる。これは計算によって情報が処分されるからだ。4は2+2より情報が少ない。だから,2+2という問題が計算の結果に置き換えられた時に不可逆性が生じる。もし,出発点と途中の計算を捨てて答えだけを残すという作業をしなければ,計算は不可逆にはならない。計算を元に戻せるので出発点に戻ることができる。だがそれには,途中の計算をとっておかなければならない。計算の意義は情報をへらすこと以外の何ものでもない。途中で何か捨てなければ,どんな計算も時間の無駄になる。計算は,可逆的なものと不可逆なものの2つのタイプに分けられる。後者は逆戻りできず,現実に面白いのはこちらのタイプ,つまり,取り返しのつかない形で情報を処分する計算だ。結果がわかっているからといって,出発点まで逆戻りすることはできない。

トール・ノーレットランダーシュ 柴田裕之(訳) (2002). ユーザーイリュージョン:意識という幻想 紀伊国屋書店 p.140.


偶然と必然

 たとえば,遺伝しないガンがあるとしよう。そのガンはランダムに起こる。そして,かかるのは人口の0.5%。まれな病気なのだ。ところが,廃棄物処理場のそばに住んでいる一家の子ども3人がこのガンにかかる。こんなことは偶然には起こりそうにないので,私たちは,廃棄物処理場のそばに住むのは危険だと言うかもしれない。何しろ,無作為に選んだ3人のきょうだいがそろってこのガンになる確率は0.05^3,つまり8000分の1である。これは,間違いなく,たいていの人が考える,偶然には起こりそうにない出来事の定義に合う。だが,米国ほどの大きさの国では,子どもが3人いる家族は100万世帯を越える。そして,これだけの家族のうち,子どもが3人そろってガンになる家族は8000世帯に1つと予想される。つまり,100万世帯のうち125世帯だ。

バート・K・ホランド 林 大(訳) (2004). 確率・統計で世界を読む 白揚社 p.120-121.

ポップコーンの正規分布

 電子レンジにかけるとポップコーンになるトウモロコシをはじけさせると,正規分布曲線が音になって耳に聞こえる。しばらくは何も起こらないが,やがて1つまた1つと粒がぽんとはじけるのが聞こえるようになる。そして次に,いくつかが一度にポンとはじけるのが聞こえる。ポンという音の間隔は短くなっていき,やがてたくさんの粒が同時にはじけ,絶え間なく音が続くようになる。うるさい音を立てながらはじける粒の数は増え,頂点に達し,次第に減っていき,1度に2つほど粒がはじけるのが聞こえるだけになる。ついには,ポンという音の間隔が数秒になる。


バート・K・ホランド 林 大(訳) (2004). 確率・統計で世界を読む 白揚社 p.77-78.

bitFlyer ビットコインを始めるなら安心・安全な取引所で

Copyright ©  -- I'm Standing on the Shoulders of Giants. --  All Rights Reserved
Design by CriCri / Photo by Geralt / powered by NINJA TOOLS / 忍者ブログ / [PR]