テストの初期のころは,極端に高い妥当性の報告が散見された。そういう報告は,ベン・ウッドやウィリアム・ラーニドなどテストの普及者から,しばしば出てきた。だが,数字は低下してきた。ETSの大半のテストは,0から1までのスケールで見て,0.4近辺の妥当性を示した。予測的妥当性は通常少し高めで,成績とテスト得点を組み合わせると(チョーンシーがハーバード大学の副学部長時代に考え出した方法),いずれか片方だけを見た場合より高い,0.5付近の予測的妥当性になる。確かにテストは十分有用ということになるが,それでもSATの点数自体は,大学1年目の成績の変動の約15%を説明するにすぎない。これはかなり乏しい成果で,チョーンシーがテストに対して思い描いた壮大な役割にはまったく及ぼなかった。
ニコラス・レマン 久野温穏(訳) (2001). ビッグ・テスト:アメリカの大学入試制度 知的エリート階級はいかにつくられたか 早川書房 pp.107
PR