読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
われわれは現代英語で使われている単語をすべて含んだ記述的辞書を独自に作成することにした。考え方は単純だ。ある文字列が英語で書かれた現代の文の中にかなりの頻度で登場すれば,それは単語だとするのである。では,どの程度の出現頻度なら十分と見なせるのだろう?この場合の線引きには,辞書に項目として採用されている中でもっとも出現頻度が低いものの値を利用するのが自然だろう。その出現頻度を算定すると,ほぼ10億語につき1回という値が得られた。したがって,「英語の単語とは何か」の答えは次のようになる。
英語の単語 ある特定の1グラムの文字列で,10億の1グラムからなる英文中に少なくとも1回は登場するもの。
エレツ・エイデン ジャン=バティースト・ミシェル 坂本芳久(訳) (2016). カルチャロミクス:文化をビッグデータで計測する 草思社 pp. 103-104