フラミンガム心臓研究のような長期にわたる研究は,さまざまな変数が発病リスクに単一ないしは合同で及ぼす影響を調べるように設計される。従来疫学者たちは,結果として得られる多重クロス分類のアレイを念入りに調べて——コーンフィールドによれば「熟慮して」——データを検討してきた。たとえば,3つのリスク因子がそれぞれ「低い」,「中程度」,「高い」の3つのいずれかに人々を分類する場合には3×3のシンプルなマス目ができる。ところが変数の数が増えて,しかもそれらの単独の影響だけでなく複合的な影響も考えるとなると,「熟慮」すべきマス目の数はすぐにふくれあがって手に負えなくなる。10のリスク因子をそれぞれ「低い」,「中程度」,「高い」のレベルに分けて行うクロス分類の研究では,検討すべきマス目の数は5万9049[3の10乗]個になる。そこで1つのマス目に10名の患者をあてるとすると,フラミンガムの全人口を上回る60万人の群(コホート)が必要になる。
ここでコーンフィールドは,「単純な調査ではなく,より探究的な形の分析」が必要だということに気がついた。それには,観察したことを要約するための数理モデルを開発しなくてはならない。そこでコーンフィールドは,心臓血管疾患による死亡率を事前の知識としてベイズの法則を使うことにした。フラミンガムの研究からは心臓疾患で死んだ人とそうでない人の2つのグループに関するデータが得られていた。各グループの,7つのリスク因子に関する情報が手に入っていたのだ。そこでベイズの法則を使って計算したところ,ロジスティック回帰関数の形をした事後確率が得られたので,それを使って心臓血管の疾患のもっとも重要な4つのリスク因子を突き止めた。それによると,年齢そのものはさておき,問題なのはコレステロールと喫煙と心臓の異常,そして血圧だった。
シャロン・バーチュ・マグレイン 冨永星(訳) (2013). 異端の統計学 ベイズ 草思社 pp.215-216
PR