読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
それは出現頻度である。実を言うと,辞書は使用頻度の高い単語を見事にカバーしている。dynamite(ダイナマイト)など,100万語あたりの出現回数が1回を超す単語については完璧なまでに網羅している―文字どおり,すべての単語が100パーセント載っているのだ。少なくとも平均で10冊の本に1回は登場する単語なら,滞りなく辞書に登録されて定義されるはずである。
しかし,辞書編纂者たちも出現頻度の低い単語を相手するときは苦戦する。出現頻度が100万語当たり1回より低くなると,その単語が辞書から除外される可能性は急激に高くなる。出現頻度が10億語当たり1回よりわずかに高い単語の場合,辞書が着目するのは全体の4分の1にすぎない。
エレツ・エイデン ジャン=バティースト・ミシェル 坂本芳久(訳) (2016). カルチャロミクス:文化をビッグデータで計測する 草思社 pp. 108-109