【番外編】適性検査の
品質と効能・限界について

多くの企業の採用選考で利用されている適性検査「SPI」。
就職活動を進めていくと、一度は受ける可能性が高いテストです。

本記事では、適性検査になぜ「品質」という観点が大切なのか、「品質」を判断するうえでの3つのポイントを紹介します。

適性検査の測定対象となる一般知的能力や性格などの人の特性は、重さや長さのように物理的な実体があるわけではなく、概念的なものです。そのためか、それを測る適性検査の「品質」の良し悪しについて語られることは多くありませんが、心理統計の分野では長年１つの研究対象となっており、考え方や指標が整理されています。

良いテストは「測ろうとする人の特徴を誤差なく正確に表せる」「実施目的に沿った適切な情報が得られる」「結果を基準とする集団の水準と比較できる」といった条件を満たしている必要があり、これらの概念を「信頼性」「妥当性」「標準性」と呼んでいます。では、どのような作り方をすれば十分な品質を確保したテストが実現できるのでしょうか。

重要な3つの観点

信頼性について

通常テストは、測ろうとする能力や性格特徴に合わせた問題や質問を作り、それをまとめた〇〇能力や△△性などの「測定尺度」を設定しています。しかし、問題や質問は作っただけでは意図したものを測れるかが分からないため、実際に回答データを集めて解析し尺度としてのまとまりや安定性があるかを確認する必要があります。このプロセスを経ないと、機械製品に例えれば試作品をそのまま販売するようなもので、何を測っているのかを保証できないことになってしまいます。SPIについては、例えば言語能力を測る基礎能力検査では、１問１問について下表のようなトライアルデータ分析を行い、識別力や難易度が確認された問題だけを使用する、といった運用をルール化しています。

テストの信頼性については、その程度を表す「信頼性係数」と呼ばれる指標があり、これが0.8程度以上であることが１つの目安になっています。

【図表：項目分析例】良い問題と悪い問題

【図表：項目分析例】説明
例として語彙問題を取り上げていますが、どの問題についても以下のような手続きで、良し悪しをチェックしています。トライアルの対象とする問題を集めて数百名以上の被検者に回答してもらい、

トライアルの対象となるテスト全体の得点で被検者を上位群・中位群・下位群に区分し、それぞれの選択状況を確認します。
上位群ほど正答の選択率が高く、中位群・下位群になるほど誤答を多く選んでいると、測ろうとする能力の高低を識別できているということになり、良い問題と判断されます。
上位群が正答を選べない、どの群にも回答の選択状況に違いがないなどの場合は、識別力のない問題ということになり、その原因を検討して修正したり問題として不採用にしたりすることになります。

良い項目例は②の条件を満たしており使用可能と判断されますが、悪い項目例は、おそらく言葉の辞書上の意味と一般的な語感のズレが原因で③の状態になっており、問題として使うことができないということになります。

妥当性について

採用選考で使われるテストは、その結果が入社後の行動や評価と関係することが確認されている必要がありますが、それを検証するためには受検者の得点と入社後の活躍度などとの関係を分析するといった追跡研究が必要です。SPIについては、利用企業の依頼を受けてその企業で活躍する人材にどのような特徴がみられるかの分析を行っています。
またそれに加えて、多くの企業と協力して数千から1万名規模のデータを収集し、入社後の行動や評価とSPIの結果に一定の関係性があることを確認する妥当性の検証作業も定期的に実施しています。実施には入社者に対する評価情報を収集するなど企業の協力が必要で手間もかかりますが、重要な場面で使われるものであるため不可欠なものと考えています。

標準性について

受検者の特徴を正確に把握するうえでは、想定する母集団（就職を希望する大学生など）のなかでの位置を示す情報が求められます。最も一般的に使われるのは「偏差値」ですが、正確な偏差値を提示するためには、母集団を代表する十分な数のデータが必要です。例に挙げた「就職を希望する大学生」の場合、数は多くても限られた大学で収集したデータでは、比較の対象とすることはできません。また、一度偏差値の算出基準を決めても集団の傾向が変化する可能性があるため、継続的に確認することが必要になります。SPIについては、偏差値と同様の「標準得点」で結果を報告していますが、1年間に約215万人が受検しており（2021年実績）、母集団を代表する豊富な基準集団のデータを持っています。

効能と限界

ここまで述べてきたように、SPIはテストとしての高い品質を実現できるように作られており、採用選考という応募者に関する情報が少なく、しかも短期間に合否を決めなければならない状況で、客観性と予測力のある情報を提供するという効能を発揮しています。一方で、適性テストには「（品質は高くても）確率のツールである」という限界があり、企業の人材採用の成功確率を高めることはできても100%当たるものではなく、応募者のすべてが分かるわけでもありません。基本的には、あくまで意思決定の補完ツールとして利用されるべきものであると考えています。

昨今では、SPIの以上のような特徴を踏まえて、入社者や在職者の自己理解・相互理解の促進ツールや、配置・配属検討時の参考データとしての利用も増加しています。詳細は、SPIは企業でどのように使われているのかをご参照ください。