科学者がべき分布に興味をもつ理由は2つある。第1に,なんの共通性もないと思われる事象の測定結果に,べき分布が頻繁にあらわれるということだ。最も初期に発見されたべき分布の1つは,1930年代に言語学者G.K.ジップが作成した,英語の語の使用頻度に関するグラフである。大きなコーパス(言語資料)を使って語の使用回数を調べると,10余りの語がきわめて頻繁に(1パーセント以上,つまり100語に1語以上の頻度で)使用されている。the(7パーセント),be(4パーセント),of(4パーセント),and(3パーセント),a(2パーセント)などがこれにあたる。次に約3000語(confidence, junior, afraidなど)が中程度の頻度で(1万語に1回程度)使われ,1万語(embitter, memorialize, titularなど)が100万語に1回使用される。そして100万語に1回をはるかに下回る頻度で使われる語が数十万語ある(kankedort, apotropaic, deliquensceなど)。
スティーブン・ピンカー 幾島幸子・塩原通緒(訳) (2015). 暴力の人類史 上巻 青土社 pp.386
PR