コラム

人事コンサルタントの視点

人事アセスメントの信頼性と妥当性(後編・妥当性)

妥当性とは

妥当性は、アセスメントが使う目的にあっているかどうかを表した概念です。そのアセスメントツールが測りたいものを測っているなら妥当性は高くなります。例えば、体重計は体重を測りたいのであれば妥当性が高いですが、身長を測りたいのであれば妥当性は下がります。英語力を知りたい時にTOEICは妥当性が高いですが、日本語力を知りたい時には妥当性が低いと言えます。
妥当性はアセスメントツールが単体で持つ性質ではなく、利用目的との関係によって高くなったり、低くなったりするものなのです。アセスメントツールが完成し、一般に使われるようになってからも継続的に妥当性の検証が行われます。妥当性検証の積み重ねによって、それぞれのアセスメントツールがどのような目的や場面に適しているかについてのより詳細な情報が集まり、利用目的や使い方、測定対象などが改善されていったり、新しい使い方が見出されたりします。

妥当性は人事アセスメントの利用価値そのものですのでとても重要です。妥当性がないアセスメントの実施は時間とコストの無駄になるだけでなく、アセスメント結果のデタラメな使い方による誤った人事判断が会社の生産性と社員のエンゲージメントの両方を低下させるという大惨事を招くことになります。絶対に妥当性のない人事アセスメントを使わないでください。

妥当性の確認方法

妥当性も信頼性のように複数の種類と確認方法があります。現在も研究者の間では妥当性に関する新しい概念や確認方法が検討されていますが、一般的には以下3つの観点から妥当性を確認します。

1.実証的妥当性
最もわかりやすい妥当性の確認方法は、アセスメント結果と職務パフォーマンスとの相関を調べる方法です。相関が見られた場合、そのアセスメントは妥当性があると言えます。この妥当性を実証的妥当性といいます。人事アセスメントの目的は採用選抜や配置、能力開発がほとんどでしょうから、アセスメント結果によって職務のパフォーマンスやコンピテンシーの発揮度合を予測できることは利用目的に適っています。簡単に言うとアセスメントがよく当たるかどうかについての妥当性です。
この妥当性の検証には相関分析を使うため、妥当性の程度を相関係数で表すことができ、この相関係数を妥当性係数と呼びます。妥当性を分析する際にパフォーマンス指標として人事考課(査定)、業績評価、行動評価、昇進スピード、研修評価、エンゲージメントサーベイなどが用いられますので、妥当性係数はこれらの指標をどの程度予測できるかを表していると言えます。
一般に適性テストでは0.3~0.4程度、客観面接では0.1~0.2程度、アセスメントセンターでは0.5程度の妥当性係数が報告されています。妥当性係数を2乗すると予測したい指標の説明率を表す決定係数となります。つまり、適性テストだけでも職務パフォーマンスのばらつきの10%くらいを説明できるのです。なあんだ、たったの10%かあ、と思われるかもしれませんが、人と仕事の複雑さを考えてみれば、上出来です。また、人の予測がどれほど難しいものかおわかりいただけると思います。

この妥当性にはさらに以下の2つの方法があります。

・一致的妥当性
一致的妥当性とは、アセスメントの得点と同時に測定された職務パフォーマンスとの相関です。社員にアセスメントを実施し、その得点とその人たちの現在の職務パフォーマンス得点との相関を調べます。

・予測的妥当性
予測的妥当性とは、アセスメントの得点と将来の職務パフォーマンスとの相関です。この妥当性は選抜や配置(将来の職務成果を予測したい場面)でアセスメントを使う際に参考にする情報ですが、長期雇用を前提とする日本企業においては極めて重要です。社員にアセスメントを実施して一定期間が経過した後、アセスメント得点と一定期間経過後の職務パフォーマンス得点との相関を調べます。妥当性が確認できるまでに数年かかることが一般的です。10年後、20年後の環境変化を予測することは困難ですが、将来に渡って自社で活躍する人材を選ぶための重要な情報となります。

2.内容的妥当性
内容的妥当性とは、アセスメントが仕事の内容に適切かどうかです。測定項目と仕事をする上で必要な行動や能力が合理的に関連している程度を表します。プロ野球の入団テストでは一次試験に50メートル走と遠投が課されます。プロ野球選手であればどのポジションであろうと、一定以上の走力と投力が必要であると考えることは合理的です。一般的には職務分析でこの妥当性を確認します。

3.構成概念妥当性
構成概念妥当性は、アセスメントが理論的に構成概念を測定している程度を示します。構成概念とは、言語能力、数値的推理力、リーダーシップ、情緒安定性、ヴァイタリティなどのことです。例えば、現在開発中の創造力テストの得点とパーソナリティ検査の創造性の因子得点に相関があれば、この妥当性を表す情報となります。また、内部一貫性信頼性もこの妥当性を確認するための情報です。ある構成概念を測定する項目間で一貫性が欠如していたら、この妥当性が低いとみなします。

これら3つ以外の視点として、アセスメントが受検者や利用者にとって適切そうかどうかを表す表面的妥当性があります。この妥当性は利用者の納得性に影響をしますので、アセスメントの売れ行きには大きく関係しますが、アセスメントの予測力とは全く関係がありません。
近年の研究でアセスメントを特定の目的で使用した際の結果を妥当性に含める結果妥当性という考え方が提案されています。アセスメントの利用目的を人材の適正化により企業業績を改善するとした場合には、実際に業績が改善されたかどうかを妥当性に含めるというものです。重要であるという意見や意味を拡張し過ぎであるという意見もある妥当性です。

妥当性検証を行う上での注意点

実際に妥当性検証を行うにあたって、いくつか注意すべきことがありますので述べておきます。

これからアセスメントを実施するという場合は、職務分析を行って職務パフォーマンスに関係しそうな能力や行動特性を特定し、それらを測ることができるアセスメントツールを見つけます。既にアセスメントを実施している場合でも職務分析を行うことで、今使っているアセスメントツールが適切であるかどうかを確認することができます。

サンプル数の確保が重要です。十分な数を確保できるとは限りませんが可能であれば100人、最低でも30人のデータは必要です。少ない人数の場合は分析結果の解釈には十分注意してください。30人未満の場合は統計分析をあきらめてください。

客観的な職務パフォーマンスのデータを作ることはどの会社にとっても難しい課題です。しかし、信頼性の低い職務パフォーマンスでは高い妥当性が得られることはありません。客観的な事実に基づく評価点と評価者の観察などによる評価点をできるだけ多くバランスよく収集してください。

妥当性検証は社員を対象に行う分析です。社員は採用時に特定の能力を評価され選ばれた人です。つまり、社員(特に特定の職種に従事する人)は職務に求められる能力について高いレベルでばらつきが少ない集団であることが多いのです。この集団を対象に分析すると実際よりも妥当性が低いという結果になります。(妥当性係数を補正する方法については当社コンサルタントにお尋ねください。)

信頼性と妥当性

最後に信頼性と妥当性との関係を覚えてください。ある目的に対して妥当性がない信頼性の高いアセスメントはありますが、信頼性がない妥当性の高いアセスメントはありません。アセスメントは測定項目を一貫して正確に測れて、はじめて職務パフォーマンスを予測できる可能性が生まれます。信頼性は妥当性の前提条件です。

終わりに

今回はアセスメントの品質に関する重要な概念である信頼性と妥当性について述べました。
妥当性が人事アセスメントにとっていかに重要な価値であるかおわかりいただけたとしたら幸いです。ぜひ皆様のタレントマネジメント施策を進める際に必要となるアセスメントツール選定の参考にしてください。また、現在使っているアセスメントツールや手法について改めて情報を確認し、妥当性を検証していただきたいと存じます。妥当性検証はアセスメントを使う全ての方にとって必要な取り組みです。

メールマガジン登録

日本エス・エイチ・エルのメールマガジンではタレントマネジメント・人材採用に関する様々な情報を発信しております。

メールマガジンに登録する

組織人事や採用の問題解決は
日本エス・エイチ・エルに
ご相談ください

サービスをもっと知りたい方

資料ダウンロード

サービスの導入を検討している方

お問い合わせ