I'm Standing on the Shoulders of Giants.

読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。

   
カテゴリー「算数・数学・統計」の記事一覧

データの奴隷

職場には,おそらくほかのどんな場所よりも,わたしたちがデータの「奴隷」になり,自分の生み出した情報に縛られる危険がある。いまやキーボードで入力した内容は,すべて記録し,数学的に分析できる。もしも上司が望むなら,部下が書いた電子メールに出現する単語の統計も取れる。その結果を,頻度が高いほど大きな文字で表示することも可能だ。部下としては,自分が売っている薬とか,勧めている株の銘柄とかの名前よりも,「映画」や「ビール」のほうが大きく表示されないことを祈るしかない。ウォール・ストリート・ジャーナル紙をインターネットで読むことも,分析の対象になる。どの記事を読んだかは,雇用者に筒抜けだ。さらには,人々が交わす電子メールの宛先を集計し,人間関係を浮かびあがらせるソフトウェアも売られている。
 このような道具を駆使すると,従業員の生産性,仕事への満足度,同僚との相性などについて,信頼度の高い結論を引き出せる。仲間との共同作業において,結局のところ,あなたがどう振る舞うかが見えてくる。マイクロソフトが2006年に特許出願した技術では,オフィスで働く人々の心拍数,血圧,皮膚の電気抵抗,顔の表情などを監視する。その目的は,労働者が感じる欲求不満やストレスの高まりを検知して,管理職に警告を出すことだ。

スティーヴン・ベイカー 伊藤文英(訳) (2015). NUMERATI ビッグデータの開拓者たち CCCメディアハウス pp.33

ケトレーのドグマ

個人の特性の分布は正規分布になるはずであるという,いわば「ケトレーのドグマ」というべきものは,その後多くの分野における統計的分析において用いられている。すでに19世紀において,「統計学者は特性値の分布が正規分布になることを数学者が証明したと思い,数学者は統計学者がそのことを経験的に実証したと信じている」と批判されたにもかかわらず,現在でも「ケトレーのドグマ」の影響はなくなってはいない。知能指数IQの分布は正規分布になるということが仮定されることが多いのはその例である。
 ただし,偶然変動する量について正規分布を仮定するのは,それを分析の出発点におけるモデルとして設定する限り,十分な合理性があるのだが,ここでは深入りしない。

竹内 啓 (2010). 偶然とは何か:その積極的意味 岩波書店 pp.193

regression=回帰?

現在では,統計学上のregressionという用語は「回帰」と訳される。そしてこの訳語にも含まれている「もとにもどる」という意味は,まったく失われている。ゴールトンのもともとの意味では,regressはprogressの反対語であり,むしろ一時使われたこともある「退行」という訳語のほうが正確な意味を伝えていると思う。
 もし遺伝の基本原則が「退行」であるならば,突然変異によってある変異が生じたとしても,それは子孫の間では消えてしまうはずであり,新しい変異が固定するためには,同じ方向への突然変異が繰り返し起こらねばならないことになる。そのようなことが起こる確率はいちじるしく小さいと思われても当然であろう。

竹内 啓 (2010). 偶然とは何か:その積極的意味 岩波書店 pp.136

信頼係数

実際には,信頼係数99%ということは,特定のデータから計算した信頼区間がmの値を含むことは「ほぼ確実である」ということを意味すると解釈されるであろうし,またそう解釈することができないのでは,統計的方法を現実に応用できなくなってしまう。
 より詳しくいえば,
  信頼区間がmの値を含む確率は99%である
   ↓
  標本を何回も取ってそのたびに計算すると,百回のうち99回は信頼区間がmの値を含む。
   ↓
  したがって,特定の標本に対して,そこから計算される信頼区間はほぼ確実にmを含む(その確率は99%である)。
   ↓
  標本を観測してxbarの値を得,それから信頼区間を計算すると,それはほぼ確実にmの値を含んでいる。その確からしさは99%である。ここでmは確率的に変動する量ではないということにこだわるならば,確率ということばは避けて信頼係数99%といってもよいが,それはこの特定の区間がmを含んでいることの確からしさの尺度と考えるべきであって,多数回の繰り返しの中の比率ではない。
ということになるのである。

竹内 啓 (2010). 偶然とは何か:その積極的意味 岩波書店 pp.114-115

確率とは

確率の解釈について,いろいろな考え方があることを述べたが,それらは互いに背反するものではない。むしろ,それらは確率の概念を適用する範囲の違いと考えるべきである。両端の極端な考え方,つまり「確率は頻度そのものであり,一回限りの事象には適用すべきではない」とする確率=頻度説と,逆に「確率とは個人が感じる心理的な確からしさの尺度である」という主観確率=心理説を除けば,「確率とはある事象が起こること(あるいはすでに起こったがまだその結果が知られていないこと)の確からしさの合理的な尺度である」という定義には異論はないはずである。

竹内 啓 (2010). 偶然とは何か:その積極的意味 岩波書店 pp.82

ランダムになるもの

客観確率が想定するようなランダムな系列を表す現象は現実に存在するであろうか。実際に発見され,経験的に検証されたものには次のようなものがある。
 (1)測定の誤差。ものを測定するとき,測定値と真の値との間にはどうしても誤差が生じる。測定を注意深く行えば,誤差はランダムになると思われる。そうして誤差の分布は正規分布になる。このことから測定をN回繰り返してその平均値(算術平均)をとれば,誤差は1/root(N)になることが導かれる。また,誤差の分布が正規分布であるという仮定から,ガウスは最小二乗法を導いた。
 (2)サイコロ,カード遊び,ルーレットなど,多くの賭けの道具のもたらす結果。昔から,賭けにおいては,結果がランダムでなく,したがって結果をある程度知ることができるようなメカニズムは「インチキ」として厳しく咎められた。そこで「公正な賭け」を行うために,ランダムな系列が得られるようなものが選ばれ,あるいは作られたのである。
 (3)事故のような偶然事件。大きな集団の中で比較的まれに発生するような事件が,一定期間内に発生する回数は,簡単な確率モデルを仮定すればポアソン分布になるが,現実にそのような分布が発生することを確かめたのはドイツの統計学者ポルトキエウィッツである。彼はプロイセンの軍団で,一軍当たり一年間に馬に蹴られて死んだ兵士の数を調べて,その分布がポアソン分布になっていることを示し,このことを「少数の法則」と名づけた。その後,一定期間に一定地域内で発生する事故の件数などの分布が,かなりよくポアソン分布で近似できることは多くの事例で確かめられている。
 (4)遺伝法則。メンデルは両親からの遺伝子が子に伝えられる場合,その組み合わせが確率的になると考えられることを示した。例えば,両親のもっている遺伝子がともにAaで表わされる場合,伝えられた遺伝子が
  AA Aa aa
となる比率が1対2対1になることを,有名なエンドウマメの実験で確かめた。
 (5)時間の中でランダムに起こる事象。この場合,簡単な確率の議論から,ある時点から次に事象が起こるまでの時間をTとすると,Tが指数分布に従うことが導かれるが,実際に多くの事象についてこのことが観測される。特に放射性元素について,1つの原子が放射線を出して崩壊するまでの時間は確率的に変動することが知られている。このような現象がポアソン過程といわれている。

竹内 啓 (2010). 偶然とは何か:その積極的意味 岩波書店 pp.66-68

ランダム

現実にランダムな現象が存在するか否かは,検証してみなければならない。もちろん実際には無限回の実験を行うことは不可能であるから,十分多数回の実験の結果がほぼランダムな系列になっていることを確かめれば,それはランダムと見なすことができるであろう。そうしてまた,ある種の実験の結果がランダムな系列になることが経験的に知られていれば,同じ条件で行われる他の実験の結果もランダムになると考えてよいであろう。

竹内 啓 (2010). 偶然とは何か:その積極的意味 岩波書店 pp.66

どちらを買う

例えば宝くじを買う場合,2枚のくじがあって,それぞれの番号が
  1,000,000番
  4,194,304番
であったとしたら,最初のくじを買う人はいないであろう。しかし,客観的に考えれば(わざわざ頻度をもち出さなくても)この2枚のくじが当たることは「同じ程度に確からしい」ことは明らかである。しかし,そのことを理解している人でも(筆者自身を含めて)最初のくじのような「不自然な番号が当たるはずはない」という心理が働くことは避けられない。しかし,そこでさらに,実は
  4,194,304 = 2^22
であって,したがってこれを2進法で書くと
  10000000000000000000000
となることがわかったら,今度はこの番号を買おうとする人はずっと少なくなるであろう。
 

竹内 啓 (2010). 偶然とは何か:その積極的意味 岩波書店 pp.48-49

言語とアイデア

簡単なたとえ話を使うとわかりやすいかもしれない。日本文学を専攻している教授と会ったとする。この教授が日本語を読み書きし,話せる可能性は非常に高い。しかし,しかし,教授が研究中にもっとも時間をかけて考えているものは何か当ててみてくれと言われたら,あなたは「日本語」とは答えないだろう。日本語は,日本文学を構成する文化,歴史,テーマを研究するために必要な知識の1つに過ぎない。その一方で,完璧な日本語をしゃべれる人の中にも日本文学をまったく知らない人もいるだろう(おそらく,日本にはそういう人が数百万といるはずだ)。
 コンピュータのプログラミング言語とコンピュータ科学の主要なアイデアとの関係もこれとよく似ている。コンピュータ科学の研究者たちは,アルゴリズムを実装し,試してみるために,アルゴリズムをコンピュータプログラムに変換する。そして,個々のプログラムはJava,C++,Pythonなどのプログラミング言語で書かれる。だから,プログラミング言語の知識はコンピュータ科学者にとって必要不可欠である。しかし,それは単なる前提条件に過ぎない。研究者の主要な課題は,アルゴリズムを発明,修正,理解することである。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.302-303

コンピュータとは

もちろん,コンピュータで頭脳の正確なシミュレーションができるかどうかという問いはまだ結論にはほど遠い状態である。科学的な視点からは,根本的な障壁はないように見える。化学信号と電気信号が脳内で伝送される仕組みの低水準の詳細はかなりよくわかっている。その一方で,さまざまな哲学的議論は,脳の物理的なシステムとは質的に異なるものなのだと言っている。これらの哲学的議論はさまざまな形を取っており,たとえば私たちの自己省察能力,直観,霊性への訴えかけなどを基礎に置くことができる。
 実は,この問題とアラン・チューリングが1937年に書いた決定不能性についての論文には魅力的なつながりがある。ただし,この論文の題名はかなりわかりにくい。「計算可能数について(On computable numbers……)」という穏当な文句で始まるのだが,「およびその決定問題への応用(……with an application to the Entscheidungsproblem)」という耳障りな文句で終わるのである(このタイトルの後半部分にはあえて触れない)。1930年代の「コンピュータ」という単語が今の普通の使い方とは全く異なる意味をもっていたことを理解しなければならない。チューリングにとって,「コンピュータ」とは紙と鉛筆で何らかの計算を行う人間のことである。つまり,論文タイトルの「計算可能数」という部分は,原則として人間が計算できる数のことである。しかし,チューリングは自分の議論を支えるために,同じく計算を実行できる特別なタイプの機械(チューリングにとっての「機械」とは,今の私たちなら「コンピュータ」と呼ぶものである)のことも論じている。論文の一部は,特定の計算がそれらの機械では実行できないことの証明に当てられている。これは,私たちがこの章で詳しく論じてきた決定不能性の証明である。しかし,同じ論文の別の部分では,チューリングの「機械」(コンピュータと読める)が「コンピュータ」(人間と読める)によってなされるあらゆる計算を実行できるという詳細で魅力的な議論を行っている。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.293-294

リレーショナルデータベース

私たちが使ってきた表のように,相互につながりを持つ表にすべてのデータを格納するデータベースを「リレーショナル」データベース(関係データベース)と呼ぶ。リレーショナルデータベースは,IBMの研究者,E.F.コッドが1970年に書いた「A Relational Model of Data for Large Shared Data Banks」というおそろしく強い影響を与えた論文のなかで推奨したものである。科学分野におけるもっとも優れた発想にはよくあることだが,リレーショナルデータベースは,あとから考えるとずいぶん単純に見える。しかし当時は,情報の効率のよい保存と処理に向かって非常に大きな1歩を踏み出したものだったのである。リレーショナルデータベースに対するほどあらゆる問い合わせへの解答としての仮想テーブルは,ごく一握りの操作(先ほど示した「選択」,「結合」,「射影」などの関係代数の演算)だけで生成できる。そのため,リレーショナルデータベースは,効率のよい構造に作られた表にデータを格納する一方で,別の形でデータが格納されていなければ答えられないように見える問い合わせにも仮想テーブルトリックで答えられる。
 リレーショナルデータベースが大部分のeコマース活動で使われているのはそのためである。何かをオンラインで購入するたびに,あなたは製品,顧客,個々の売買契約についての情報を格納するリレーショナルデータベースの一連の表を操作している。サイバースペースでは,それと気づきさえしないうちに,私たちはリレーショナルデータベースに囲まれているのである。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.221-222

クラッシュ

今までの説明を読むと,私達が不必要にクラッシュの可能性にこだわっているように見えるかもしれない。結局のところ,今のアプリケーションプログラムを実行している今のオペレーティングシステムなら,クラッシュを起こすことは非常にまれなのだ。しかし,この疑問には答えるべきことが2つある。まず第1に,ここで使っている「クラッシュ」の概念は,かなり一般的である。コンピュータが機能を止めてデータを失うようなあらゆる事故を網羅している。考えられることとしては,電源異常,ディスクエラー,その他のハードウェアの誤動作,OSやアプリケーションプログラムのバグなどがある。第2に,一般化しようがクラッシュが起きるのはまれだとしても,銀行,保険会社など,データが実際の金額を表している会社のシステムでは,どのような状況でもレコードに不一致が含まれていてよいことはない。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.196

トランザクション

データベースの世界でもっとも重要な観念は,おそらくトランザクション[英語のtransactionは,取引,処理などを意味する。データベースにおけるtransactionは,日本語文献でもトランザクションとカタカナ表記するのが普通なので,ここでもトランザクションという言葉を使う。意味についてはすぐあとを参照のこと]。しかし,トランザクションとは何なのか,なぜ必要なのかを理解するためには,コンピュータについて2つの事実を受け入れなければならない。最初の事実は,たぶん誰もはいやというほど知っていることである。コンピュータプログラムはクラッシュする。そして,プログラムはクラッシュしたときに,自分がしていたことをすべて忘れてしまう。コンピュータのファイルシステムに明示的に保存された情報だけが残る。知らなければならない第2の事実は,だいぶわかりにくいが,きわめて重要なことである。コンピュータのハードディスクやフラッシュメモリーなどの記憶装置が瞬間的に書き込めるデータはごくわずかで,一般的には約500字ほどである(専門用語に関心のある読者に説明しておくと,ここで言っているのはハードディスクの「セクターサイズ」のことで,一般に512バイトである。フラッシュメモリーの場合,問題になるのは「ページサイズ」だが,やはり数百〜数千バイトである)。最近のドライブは500字の書き込みを1秒に数百,数千回実行できるので,普通のコンピュータユーザーは,デバイスに瞬間的に書き込めるデータのサイズがこのように小さく制限されていることには気づかない。しかし,ディスクの内容は,1度に数百字ずつしか書き換えられないのは事実である。
 このこととデータベースにいったいどのような関係があるのだろうか。実は,きわめて重要な意味がある。一般に,コンピュータは,同時にデータベースの1行分しか更新できないのだ。先ほどの非常に小さくて単純なサンプルサイズでは,これを実証できない。上の例は,表全体で200字に足りないので,コンピュータは2行を同時に更新できるだろう。しかし,一般に合理的な規模のデータベースでは,2つの異なる行を書き換えるためには,2回の別々のディスク操作が必要である。
 以上の事実をはっきりさせると,問題の核心に入っていくことができる。データベースに一見単純な変更を加えようとすると,複数の行を書き換えなければならない。そして,今わかったように,2つの異なる行の書き換えは,1回のディスク操作では実行できない。そのため,データベースの更新は,複数回のディスク操作を連続的に行った結果となる。しかし,コンピュータはいつでもクラッシュする可能性がある。コンピュータがこのような2回のディスク操作の「間に」クラッシュしたらどうなるだろうか。コンピュータをリブートすることはできるが,クラッシュしたときに実行することになっていた処理のことは忘れている。そのため,必要とされる変更が実行されない場合がある。つまり,データベースが一貫性のない状態に取り残される場合があるということだ。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.190-192

圧縮

データやら情報やらを壊さずに「本当の」サイズよりも小さくし,あとですべての情報を完全に作り直すなどということが,どうすればできるのだろうか。実は,人間は,そうと考えもせずに始終これを行っている。例として週間のカレンダーについて考えてみよう。話を簡単にするために,あなたの仕事は1日8時間,週に5日で,カレンダーは1時間ごとに区切られているものとする。つまり,5日間でそれぞれ8時間分の枠があり,1週間あたり40時間分の枠があるということになる。そこで,あなたは自分の1週間分のカレンダーを誰か他人に知らせるときに,40個分の情報を伝えなければならない。しかし,誰かが翌週の会議の時間を押さえるために電話をかけてきたとき,40個の情報をずらずらと並べて出席できる時間を説明するだろうか。もちろん,そんなことはしないだろう。「月曜と火曜はいっぱいで,木曜と金曜は午後1時から3時がふさがっているけど,あとは大丈夫だよ」のように言うはずだ。これは,ロスなし圧縮の実例である。あなたの話を聞いた相手は,週の40時間の枠のうち,あなたが会議に出席できる時間を完全に再現できる。しかし,あなたは40個の枠全部についていちいち説明するわけではないのだ。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.162-163

20の質問と決定木

コンピュータ科学者たちにとって,「20の質問」ゲームには特別な魅力がある。このゲームでは,プレーヤーの1人があるものを思い浮かべ,ほかのプレーヤーたちは20個以下のイエス・ノーで答えられる質問に対する答えからそのものが何かを当てなければならない。あなたに20の質問をしてくる小さな携帯電話機さえ売っている。このゲームは,主として子どもを楽しませるために使われるものだが,大人がやっても意外に面白い。ゲームを始めて数分経つと,このゲームには「よい質問」と「悪い質問」があることがわかってくる。よい質問は大量の「情報」(どのような意味であれ)を与えてくれるのに対し,悪い質問は手がかりを与えてくれない。たとえば,最初の質問として「それは銅製ですか?」と尋ねるのはうまくない。答えが「ノー」だったら,可能性の幅がほとんど狭まらないからだ。良い質問と悪い質問を見分ける直観は,情報理論という魅力的な学問分野の核心である。そして,「決定木」というシンプルで強力なパターン認識テクニックの核心である。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.138

情報時代のマグナカルタ

誤り訂正符号は1940年代にはすでに存在していた。電子コンピュータ自体が誕生してからそれほど時間が経っていない。あとから考えると,その理由は割と簡単にわかる。初期のコンピュータは信頼性が低く,その部品は頻繁に誤りを生み出していた。しかし,誤り訂正符号の本当のルーツはもっと古く,電信や電話などの通信システムの頃からあった。だから,誤り訂正符号の開発のきっかけとなった2度の事件がともにベル研究所で起きたのは,驚くべきことではない。この物語のヒーローであるクロード・シャノンとリチャード・ハミングは,ともにベル研の研究員だった。ハミングにはすでに登場してもらっている。現在ハミング符号として知られる最初の誤り訂正符号が発明されたのは,ベル研のコンピュータが2回の週末にクラッシュするのにハミングがうんざりしたことからだった。
 しかし,誤り訂正符号は,「情報理論」というもっと大きな学問分野の一部に過ぎない。そして,ほとんどのコンピュータ科学者は,情報理論という学問分野の起源を1948年のクロード・シャノンの論文に求める。「The Mathematical Theory of Communication」(通信の数学理論)というタイトルのこの傑出した論文は,シャノンのある伝記作家が「情報時代のマグナカルタ」と呼んでいるほどのものである。アービング・リード(後述のリード=ソロモン符号の共同発明者)は,この論文について,「科学技術にこの論文以上に大きな影響を与えた仕事は,この世紀にはほとんどない。彼は通信理論と実践のあらゆる側面をもっとも深いところから刷新したのである」と言っている。このように高い評価が与えられているのはなぜだろうか。シャノンは,ノイズが多く誤りを引き起こしやすい回線を使っても,驚くほど高い確率で誤りのない通信を実現することが原則として可能だということを数学を通じて示したのである。シャノンが理論的に割り出した通信の最高速度を科学者たちが実際に実現したのは,それから何十年も後のことだった。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.122-123

ウェブスパムとの闘い

検索エンジンの世界では,この種の濫用を「ウェブスパム」と呼んでいる(この用語は,電子メールのスパムからの類推で作られたものである。ウェブ検索の結果を撹乱する迷惑なウェブページがあることは,電子メールの受信ボックスに迷惑なメールが届いているのとよく似ている)。すべての検索エンジンにとって,さまざまなタイプのウェブスパムを検出し,取り除いていくことは,継続的に進めなければならない重要な仕事である。たとえば,マイクロソフトの研究者たちは,2004年にちょうど1001個のページがリンクしているウェブサイトを30万以上も見つけた。これは非常に怪しげな動きである。これらのウェブサイトを手作業で調べてみたところ,そのリンクの大多数は,ウェブスパムであることがわかった。
 そのため,検索エンジンはウェブスパマーとの知恵比べに否応なく巻き込まれており,リアルなランクを返せるように,たえずそれぞれのアルゴリズムを改良しようとしている。このようにページランクに改良圧力がかかっているために。アカデミズムでも業界内でも,ウェブのハイパーリンク構造を使ってページのランク付けをするほかのアルゴリズムの研究が数多く生まれている。この種のアルゴリズムは,リンクベースランキングアルゴリズムと呼ばれることが多い。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.64

ハイパーリンク

ハイパーリンクは,驚くほど古いアイデアだ。1945年,つまりコンピュータ自体が初めて作られたのと同じ頃のことだが,アメリカの技術者,ヴァネヴァー・ブッシュは,「As We May Think」という予見的エッセイを発表した。ブッシュは,この広範な対象について論じたエッセイの中で,memexというマシンなど,彼が将来生まれるだろうと予想した様々な技術について論じている。memexは文書を保存して自動的に索引を作るが,できることはそれだけに留まらない。memexは「連想的なインデクシング,つまり,任意の項目が,ただちに,そして自動的にほかの項目を意のままに選択する機構」も持つ。つまり,初歩的な形のハイパーリンクである。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.48-49

インデクシング

インデックス(索引)の概念は,あらゆる検索エンジンを支えるもっとも基礎的な考え方である。しかし,インデックスを発明したのは検索エンジンではない。実際には,インデクシングの思想は,文章を書くこととほぼ同じくらい古い。たとえば,考古学者たちは,5000年前のバビロニアの遺跡で,テーマごとに楔形文字の粘土板の目録を所蔵する寺院の附属図書館を発見している。このように,インデクシングはコンピュータ科学でもっとも古い有用なアイデアだと言うことができる。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.28

人口の計算も難しい

総所得あるいは成長の傾向を推計するための基本的出発点は,人口を数えることである。サハラ以南アフリカの国民経済計算担当部署の標準的方法では,人口データを,定期的にデータを収集できない経済部門の測定のための乗数として使っている。非公式部門や自給自足生産では,これらの部門の国民経済への貢献を計算するのに,一人当たりの量を使って推計が作られているかもしれない。加えて,これらおよび他の部門で,経済成長はしばしば人口増加に比例すると考えられている。人口データはもちろん,開発に関する従来型の測定——実質一人当たり所得——において中心的要素であり,正確な計算なしには,教育や保健における一人当たりの傾向について何を言っても意味がない。このように,人口についてのデータは開発の測定や実践にとって不可欠なのである。人口推計はさらに,政治にも関係しており,国勢調査は選挙の選出議員数や財政支出にも直接影響する。そのため,人口の計算は,とくに権力が激しく争われている国や,国の監視力が弱いところでは議論の的となりやすい。

モルテン・イェルウェン 渡辺景子(訳) (2015). 統計はウソをつく:アフリカ開発統計に隠された真実と現実 青土社 pp.111-112

bitFlyer ビットコインを始めるなら安心・安全な取引所で

Copyright ©  -- I'm Standing on the Shoulders of Giants. --  All Rights Reserved
Design by CriCri / Photo by Geralt / powered by NINJA TOOLS /  /