テストの問題点

テストとは

　テストの研究について説明するために，まず，テストとは何であるかを明確にしておきます。ここでは，日本テスト学会による定義を紹介します。そこでは，テストとは「能力，学力，性格，行動などの個人や集団の特性を測定するための用具であり，実施方法，採点手続，結果の利用法などが明確に定められているべきもの」とされています（日本テスト学会編「テスト・スタンダード」より）。
　テストを意味する別の用語として試験がありますが，試験はテストそのものを意味する場合と，テストをすること（テスティング）を意味する場合があります。

<先頭へ戻る>　<テスト研究のページへ戻る>

テストに対する批判

　テストは，学校に留まらず，おもに教育場面において広く用いられています。それゆえ，さまざまな批判にさらされます。「テストで真の学力は測れない」「点数で人は計れない」「テストは教育を歪める」「多枝選択問題は思考力を育てない」「テストは競争を助長する」などなどです。
　しかし，テストに対する批判の中には，テストについての理解が十分でなかったり，別の問題をテストの問題にすり替えているものもあります。それらを整理すると，テストの評価の問題や，テストの使い方の問題について検討する必要があることが見えてきます。

<先頭へ戻る>　<テスト研究のページへ戻る>

テストの評価の問題

　テストに対する批判について気になることの1つは，それらの批判をする前段階において（後でも良いのですが），テストの性能や品質は評価されているのだろうかということです。テストは自然界に存在するものではありません。誰かが何らかの目的をもって作った人工物です。

　テストを使うにあたっては，どのような目的で作られたものか，その目的通りに使えるものかを確認する必要があります。また，副次的な影響はないか，あるとしたらどの程度かも確認する必要があります。これらを確認することは，製品で言えば，その性能や効能，副作用を評価することに相当します。工業製品や薬剤などでは当然のこととして行われている品質の評価や管理が，わが国の多くのテスト（とくに学校現場）では行われていない，さらに言えば必要性すら認知されていないように見えます。

　テストの評価として，作題の意図や採点基準等が公表されていたり，出題領域の専門家による講評がなされているものもあります。もちろん，そのような検討も重要ですが，それらはあくまでも作題者，専門家からみた印象評価であって，受検者にとってどのようなテストだったかを明らかにするものではありません。出題意図が受検者に伝わらない問題，テストの目的にそぐわない問題，底意地の悪いひっかけ問題，思考力と問うと言っていたずらに難易度を高くしているだけの問題，採点基準があいまいな問題，正解が正答であることが理解できない問題など，テストが実際どのようなものであったかは，受検者の立場で考える必要があります。

　これらはテストの評価に関する問題です。テストによる評価ではありません。テスト自体を評価するのです。テストは人造物であり，ときに人生を大きく左右するものであるのに，わが国の多くのテストにおいて，データに基づいたカスタマー（受検者）の視点からの性能や品質の評価は，ほとんどなされていないのです。

<先頭へ戻る>　<テスト研究のページへ戻る>

テストの使い方の問題

　上述のように，テストの評価が十分なされていないにもかかわらず，ひとたびテストの結果が開示されると，それに基づいてさまざまな議論が進められます。児童生徒学生にとって，テストはひたすら「受けるもの」であり，多くの場合，得点に一喜一憂するものになっています。教師の側も，テストの結果を利用して児相生徒学生を評価します。教員評価や教育施策の検討においても，得点のみが独り歩きします。その際，テスト自体に問題があったかという評価はほとんどなされません。

　これは，テストの使い方に関する問題と言えます。十分な性能が確認されていないものを使って，その結果を鵜呑みにし，疑問すら感じないという使い方が蔓延しているのです。

　また，受検者のほとんどが満点を取ってしまうような学校においては，テストは役に立たない，そんなテストは廃止しろ，などという主張も時々耳にします。これは，テストの使い方の問題を，テストの良し悪しの問題にすり替えた議論です。

　学校教育においてテストを実施する目的として，授業や教室単位では，学習前の理解度の確認（診断的評価），学習過程における学習の促進（形成的評価），学習後の習得度の確認（総括的評価）などがあり，自治体や国単位では，児童生徒の全般的な学習状況の把握，学習指導要領の達成度の確認，教育施策のための資料収集などが考えられます。目的を達成するためには，適切なテストを用いて，適切な方法でそれを実施する必要があります。しかし，そうなってはいない現状も多く見受けられます。

　このように，テストをその目的通りに実施し活用するためには，作成，実施，採点，運用，また，各種デバイスの利用など，さまざまな課題や問題を検討する必要があります。

<先頭へ戻る>　<テスト研究のページへ戻る>

日本のテスト文化の特徴

　主に現在日本で実施されている大規模テスト等を念頭に置き，日本のテスト文化の特徴をまとめました。詳しくは，下記の論文をご参照ください。
出典：大学入試における共通テストの複数回実施は実現可能か―日本のテスト文化やこれまで見送られてきた理由などからの検討―　名古屋高等教育研究　18　23-38　2018

テストの実施に関して

年に1回，一斉に実施される
各科目，問題冊子は1つであり，同一科目受検者は，全員同じ問題冊子に解答する
共通テスト実施から出願までの期間が極めて短い

テスト得点に関して

テスト得点として素点が用いられる
満点(100点)や0点に特別な意味を見出す
テスト得点が受検者に通知されるのは入試が終わった後である
共通テストの自己採点結果を収集して，合否予想が大々的に行われる
テスト得点の有効期限が示されていない

テスト問題に関して

テスト問題は実施後公開される
テスト問題を非公開にしても，問題を記憶するアルバイトを雇うなどして組織的に復元される
問題は毎回新しく作成される
問題は予備調査されることなしに，実際の試験で用いられる
一度出題された問題は使い捨てられ，繰り返しテスト問題として利用されることはない

テスト仕様に関して

各科目のテストの設計，問題作成，編集等を，別に職を持つ当該学問領域の専門家が，兼業として行う
大問形式が多く利用される
多枝選択式問題1問あたりの解答時間が2～4分と長めに設定されている
大規模テストとクラスルームテストの違いが明確でない
選抜テストと資格テストの違いが明確でない

テストについての理解に関して

テスト得点を過度に重視する
テスト問題の領域代表性を考えず，結果を過度に一般化する
多枝選択式テストでは学力は正しく測れず，記述式テストなら「真の学力」が測れると信じている
テスト理論が普及していない

<先頭へ戻る>　<テスト研究のページへ戻る>

テスト研究の必要性

　テスト（試験）はときに受検者の人生に大きな影響を与えます。学校や試験実施団体は，受検者の能力を適切に評価する義務があります。それを果たすには，受検者の能力を適切に評価できるテストを実施する必要があります。

　しかし，日本においては，テストを科学的に研究するテスト理論について，存在すら知らない人がほとんどでしょう。確かに，テスト理論やその周辺の研究をしている研究者の数は少ないです。テスト理論を学びたいという学生も，あまり多くはありません。

　昨今の大学入試改革騒ぎで，項目応答理論 (Item Response Theory, IRT) や，コンピュータ型テスト（Computer Based Testing, CBT）などが話題にのぼり，テスト理論の存在は，以前より少し世間に知られるようになってきました。テスト理論を学びたいという人も，ちらほら出てくるようになりきました。

　テストを科学的に研究するためには，出題分野についての理解に加え，構成概念を作り出す人間の心理に対する理解，さらに，ある程度以上の情報学や数学の力が必要です。硬い言葉で言えば，出題分野の専門知識，心理学，統計学，情報学です。テスト研究は，文理融合型で学際的な領域なのです。

　現実問題として，少なくとも今すぐ，教育現場からテストを無くすことはできないでしょう。だとしたら，その性能や品質を評価して，できの悪いテストをなくし，より良いテストを作成し，間違った使い方をしないように努力することは，意味のあることだと考えられます。そのためには，テストについて研究することが必要になります。

<先頭へ戻る>　<テスト研究のページへ戻る>

テスト研究の領域

　テスト研究は，テストを用いた研究（学力の比較など）ではありません。テストそのものを研究対象とする研究です。テストの品質評価を行い，テストをその目的通りに使えるようにすること，また，そのための様々な方法について研究します。

テスト理論

　テストの歴史はとても長いですが，テストを科学的研究の対象にするようになったのはわりと最近で，20世紀入ってからと言われています（池田，1992，2007）。そして，その研究の知見をまとめたものはテスト理論（Test Theory）と呼ばれています。テスト理論の捉え方には幅があり，例えば，服部（2011）は「テストのあるべき姿，作成手順，実施と採点手順などに関する知識体系」と広い意味に解釈していますが，大津（2011）は「能力の優劣の組織的な判定のための統計モデルの理論とその分析方法」と，統計モデルや分析法に重点をおいて解釈しています。
　テスト理論は，主に測定の信頼性と妥当性を検討する古典的テスト理論，共通尺度上でのテストの構築と実施を支える項目応答理論，誤差成分について詳細に分析する一般化可能性理論に大別されます。

教育測定学

　教室でテストと言ったとき，テストで測るものの多くは学力や能力です。このように，児童，生徒，学生の学力や能力を測定することに焦点をあてた用語として教育測定があります。石井 (2022) は，教育測定とは「学力や能力などに関する客観的な推論を行うために，何らかの尺度を用いて，学習者におけるそれらの特性を数量化すること」と定義しています。また，辰野 (2006) によれば，教育測定とは「学力あるいはそれに影響する能力・適性などを人為的尺度を用いて客観的数量的に測定する」ことであり，森 (2006) は「児童・生徒の学力を科学的・客観的に測定するための方法」と言っています。教育測定を行うための理論や方法等を研究する学問は教育測定学（Educational Measurement）と呼ばれます。

計量心理学・心理統計学

　学力や能力は物理的に存在するものではなく，性格や人格などと同様に，何らかの現象を効率的に表現するために考えられた構成概念です。構成概念は心理学の研究でよく用いられます。構成概念の測定や分析法について研究する学問は計量心理学（Psychometrics）と呼ばれます。竹村（2011）は，計量心理学とは「知能，人格，思考，学力，態度などの心理学的概念の測定に関する理論と技法についての学問」であるとしています。Psychometricsは心理統計学とも訳されますが，その場合は，統計的モデルや分析法の研究により重点が置かれています。

<先頭へ戻る>　<テスト研究のページへ戻る>