受付/8:30~18:00/月~金(祝祭日を除く)
受付/10:00~17:00/月~金(祝祭日を除く)
研究レポート
弊社が提供する総合検査SPI3の能力適性検査部分(テストセンター方式、WEB方式)では受検者によって出題される問題が変わる適応型出題という出題方式が採用されています。これに対し、受検者によって出題される問題が違うのは不公平なのではないか、と懸念をもたれる方もいらっしゃるようです。
今回の研究レポートでは、前後編2回にわたってこの懸念にお答えします。
前編では、大学入学共通テストに代表される一般的な学力テストと、採用場面で用いられることの多い能力適性検査の違いについて触れ、後編では公平なテストとはどのようなものかについて説明します。
技術開発統括部 研究本部 測定技術研究所 主任研究員
テスト、というと大学入試や学校の期末試験といった学力テストを思い浮かべる人が多いと思います。大規模なものとしては、大学入学共通テストが最初に想起されることでしょう。こういったテストでは、全員が同時に受検することを前提に、全員に同じ問題が出題されます。全員に同じ問題が出題されるのだから公平だ、とも考えられます。
弊社で大学2~4年生を対象に採用時の適性検査のイメージ調査を行ったところ「受検者によって出題される問題が変わるのは不公平だ」と回答した人の割合が4割強に及びました。例えば大学入学共通テストのような学力テストで、配られる問題が人によって違っており、難易度もバラバラだったとしたらそれは確かに公平性に欠けるかもしれませんが、採用時の適性検査でも同様に不公平なのでしょうか。
SPI3の能力適性検査では、適応型出題という仕組みを採用しており、受検者によって出題される問題が違います。出題される問題の難易度も受検者によって異なります。ではSPI3は不公平なテストなのか、というと決してそんなことはなく、きちんと公平性を担保しています。どうして公平といえるのかについてはこの後順を追ってご説明していきます。
一般的な学力テストといっても、学校の定期考査もあれば大学入試もあり、多種多様です。ここでは大学入学共通テストに代表される、専門家が作った大規模試験を例に挙げます。
荒井・前川1 によると、日本で行われている大規模試験を調査した結果、以下のような特徴があることが分かっています。
・試験は1年に1度全国一斉に実施され、同一内容の1種類の問題冊子が使用される・問題は毎回すべて新しく作成され、予備テストは実施されない・試験問題は公開される
原論文ではさらに続き、全部で10の特徴を挙げていますが、専門的な内容になるのでここでは省略します。
なお予備テストとは、本番のテストの前に問題項目分析のためのデータ収集を目的として実施されるテストです。
まとめると、全員が一斉に同じ問題冊子を使うテストであり、その試験問題は公開されて、毎年新しく作成されるということです。
これらの特徴について柴山2は「いずれも、日本の中ではごく普通にみられる大規模テストの姿であり使い方」であると評しています。この特徴を総称して「日本的テスト文化」と表現されることもあります。
試験問題が毎回新しく作成され、予備テストが実施されないということをさして「初出主義」といいますが、実は試験問題を作る苦労は並大抵のものではありません。少し情報が古いですが大学入試センター試験では、本試験と追試験の2種類のテストを作るために約2年をかけ、さまざまな観点からのチェックを行っていたそうです3。このように苦労して作成した試験問題も公開されてしまうので、翌年以降同じ問題を使うことはできません。それでもたまに、「今年の問題と○○年の△△大学の問題がそっくりだった」というニュースを見かけます。初出主義の弊害については池田4はじめ多くの指摘がありますが、今回のテーマからはずれてしまうのでここでは割愛します。
さて、「全員が初めて見る同じ問題を解くので公平である」というのは確かにそのとおりでしょう。もう少しきちんと書くと、「同じ日に同じ試験問題のテストを受けた人」の間の公平さは担保されています。
同じ試験問題でも、翌日に受けた場合はどうでしょうか。大学入学共通テストだと翌日の朝刊に主な教科の問題と解答が出るため、とても公平とはいえません。
ここで架空の大学を考えてみます。この大学でも毎年新しい入試問題を作成していて、合格ラインを100点満点の70点と決めているとしましょう。
入試問題作成委員になった先生方は、「合格ラインを超える学生ならば70点取れるはず」のテストを頑張って作成するわけです。しかも、そのへんの参考書に載っていたり他の大学の過去問題集に出ていたりするような問題を使うことはできません。池田によれば「問題作成には人が要るにもかかわらず、漏洩防止の意味もあって、問題作成委員は比較的少数に限られ、機密裏に処理される」傾向にあるので、作成は困難を極めます。
こうやってできあがったある年の試験問題の70点と、別の年の試験問題70点は同じレベルといえるでしょうか? 合格ラインが毎年揺らいでいる可能性はないでしょうか?
さて、話を学力テストから、採用場面で利用されることの多い適性検査に切り替えます。適性検査には能力適性検査と性格適性検査がありますが、ここでは正解/不正解が客観的に決まる能力適性検査に絞って説明します。
かつては応募者を試験会場に集め、一斉に紙の適性検査を受けてもらうことが普通でしたが、現在はWEBやテストセンターでの受検が普及し、都合のよい受検場所と日時を選択して受検できるということが一般的になっています。
つまり、「全員が同時に受ける」という前提が成り立ちません。
また、複数の会社に応募している場合、同じ人が何回も適性検査を受けるということが起きますが、これも一般的な学力テストとは異なります。
仮に問題冊子が1種類しかない能力適性検査を考えてみましょう。
ある日にAさんが受けたテストと全く同じ問題が別の日にBさんに出題される場合、AさんからBさんに問題内容が伝わってしまうと他の応募者と不公平になるので、問題内容は非公開にする必要があります。
次に、同じAさんが別の会社を受けたとしましょう。ここでも1種類しかないので同じ問題が出題されます。実際には全く同じ問題でも2回目から急に解けるようになって満点、なんてわけにはいかないのですが、それでも問題を解くスピードが上がったり、考える時間が短くて済んだり、ということはあるでしょう。初めて受ける人から見ると不公平です。
つまり、一般的な学力テストのように全員に同じ問題を出題し、かつその内容を公開する、というのは逆に不公平になるということです。
したがって採用場面で利用される能力適性検査は、問題内容が非公開になっていて、出題される問題も全員同じではない、という方法を取っています。
ここで別の研究レポート「人事アセスメントの品質とは?」でご説明している「標準性」が重要になってきます。別々のテスト問題であったとしても、基準となる集団に照らして相対的に得点が比較できる状態(標準性)を実現しているテストであれば、テスト問題が違っていても公平性は担保されます。
標準性の実現の背景にはテスト理論という学問分野があって、これはこれで奥が深いのですが、ここでは「きちんとした理論があって、それに基づいてきちんと開発・運用されているテストであれば出題される問題が違っていても公平である」ということをお伝えするにとどめます。
いかがでしたでしょうか。今回は前編として、大学入試のような学力検査と採用場面で実施される適性検査の違い、そしてテスト理論に基づいてきちんと開発・運用されているテストであれば出題される問題が違っていたとしても公平である、ということを説明しました。
次回後編では、もう少し「公平な測定」について掘り下げて考えます。そのうえでSPI3の適応型出題の仕組みと、この出題方式が公平なだけでなく受検者にとってもメリットがある、という点を説明します。
―能力適性検査にまつわる疑問― 受検者によって出題される問題が変わるのは不公平か?(後編)に続く
1 荒井清佳・前川眞一,日本の公的な大規模試験に見られる特徴―標準化の観点からー,日本テスト学会誌第1巻第1号,20052 柴山 直, 日本のテスト文化について, 人事試験研究2008.09号No.208, 20083 西 健太郎, センター試験の問題は誰が作成している? チェック体制は?, 高校生新聞ONLINE, 20184 池田 央, テストの科学~試験にかかわるすべての人に, 日本文化科学社, 1992
研究レポート 2025/02/17
~上司から部下へのPOSのトリクルダウン効果に着目して~
従業員の働きがいを高める“知覚された組織支援(POS)”についての研究
人事評価 ワーク・エンゲージメント 心理的安全性
研究レポート 2025/01/06
School to Work Transitionの促進に関する縦断研究プロジェクト
入社後の定着を促す、学生の「就業レディネス」とは
研究レポート 2024/09/30
―能力適性検査にまつわる疑問― 受検者によって出題される問題が変わるのは不公平か?(後編)