
t検定とは
t検定とは、2つの集団(標本)の平均値の差に意味があるかを検定する方法です。t検定にはいくつか種類がありますが、本コラムでは独立した2つの集団を扱う「対応のないt検定」におけるスチューデントのt検定について説明します。例えば、採用における募集方法を変更した際に、昨年の応募者集団と比べて今年の応募者集団に期待した変化が見られているかをOPQで確認する場合や、育成方法を検討するために高業績者とその他社員の違いをOPQで明確化したい場合などで活用できます。
2つの集団(標本)の平均値を単純に比較して異なっていたら良いのではないか、と思われるかもしれません。しかし、標本である以上、その差には必ず偶然のばらつき(サンプリング誤差)が含まれています。このばらつきの影響で、実際には母集団に差がないのに、標本データだけを見ると違いがあるように見えることがあります。そのため、統計的に有意な違いがあるかどうかも含めてデータを評価することで、より的確な施策を打つことができるようになります。

z検定とt検定の違い
z検定もt検定も「平均値の差に意味があるか」を調べる方法ですが、次のような違いがあります。z検定
- 母集団のばらつき(分散や標準偏差)が既知の場合に用いる。
- 標本サイズが大きい場合に適している。
- 例: OPQ得点は大規模な受検者集団で標準化されており、母集団(一般集団)の平均(5.5)と標準偏差(2)が分かっています。このように、比較対象となる母集団の統計量が既知の場合に、標本の平均値との違いを検定する方法がz検定です。
t検定
- 母集団のばらつきが未知で、標本データから推定する必要がある場合に用いる。
- 標本サイズが小さい場合に適している。
- 例:OPQ得点の母分散は既知ですが、観測された標本のサイズが小さい場合、母分散ではなく標本分散を利用して推定した方が適切であり、t検定を使うのが望ましいです。
このように、母集団の情報がどこまで分かっているか、標本サイズが十分かどうかによって、z検定とt検定の使い分けが必要になります。次に、具体例を用いて詳しく説明していきます。
高業績者とその他社員の比較
企業Aでは開発部門500人(高業績者=100人、その他社員=400人)における業績をあげるべく、育成方法を検討したいと考えています。育成担当者は高業績者とその他社員の違いを「問題解決力」にあるのではないかと考えていますが、データから明確化するために、開発部門500人からランダムに150人(高業績者=30人、その他社員=120人)を選択してOPQを実施することにしました。統計的検定における帰無仮説と対立仮説
高業績者とその他社員とでは「問題解決力」の平均が異なると予想している場合は下記の仮説になります。- 帰無仮説:
- 「問題解決力」における高業績者の母集団平均とその他社員の母集団平均の差は0である
- 対立仮説:
- 「問題解決力」における高業績者の母集団平均はその他社員の母集団平均より高い(または低い)
その差は誤差か
OPQ結果より、高業績者30人の「問題解決力」の平均は7.677、標準偏差2.031、その他社員120人の「問題解決力」の平均は5.611、標準偏差2.062でした。高業績者の母集団平均とその他社員の母集団平均の差が0であれば、高業績者の標本30人の標本平均とその他社員の標本120人の標本平均の差も0となるはずですが、標本から得られた値は0ではなく2.066です。この2.066が母集団から標本がランダムに抽出されたことによる誤差(標準誤差)と判断するのかどうかを計算していきます。
標準誤差の算出
t検定では、2つの標本のばらつきを統合して標準誤差を計算します。これは、2つの標本の平均値の差を検定する際に、各標本のばらつきがどの程度であるかを考慮するためです。なぜなら、データがばらついている標本では平均値の差を見つけにくく、逆にデータがまとまっている標本では敏感に差を検出できるからです。また、標本サイズが大きい標本は「より正確な情報を提供する」と見なされるため、ばらつきを統合する際には、各標本の分散を標本サイズに応じて加重平均(重み付け)します。これにより、より信頼性の高い標本が差の検出において強調されます。

上記式は、各標本の分散(標準偏差を二乗したもの)を標本サイズに応じて加重平均していることを意味しており、算出された値は統合標準偏差です。
この値に√1高業績標本人数 + 1その他標本人数をかけたものが標準誤差になります。
t値の算出
t値とは、帰無仮説(高業績者の母集団平均とその他社員の母集団平均の差は0である)を基準に、標本データ(高業績者標本平均とその他社員標本平均の差)が、その仮定された差(0)から標準誤差の単位でどれだけ離れているかを算出する指標です。t値が大きいほど、標本データが帰無仮説から大きく離れていることを示し、帰無仮説が棄却される可能性が高まります。
t分布表の自由度148、5%棄却域の値(両側検定の場合2.5%で1.976)よりも大きいと帰無仮説は棄却されます。上記は4.923ですので、帰無仮説は棄却されます。(※自由度=(30-1)+(120-1)=148)
イメージとして捉える
検定統計量の計算としては上記のものになりますが、イメージとして分かりやすくするため、下記に信頼区間と合わせた図を載せます。高評価者の標本30人とその他社員の標本120人が同じ母集団(差が0)から抽出されたのであれば、下記のような信頼区間になりますが、標本平均値差は2.066で区間内に入っていません。よって、帰無仮説は棄却されます。
おわりに
上記例では、高業績者はその他社員と比べて「問題解決力」が統計的に有意に高い(=誤差による差ではない)ことが明らかとなりました。よって、「問題解決力」に関連した育成を行っていこうという判断ができるようになります。実際には、統計的に有意でも、実務的に意味のある差かどうかといった点や、定性的な情報も含めて育成方法については検討していくことになると思いますが、「統計的に有意であるかどうか」は課題に対する解決策の判断に有効な手段の1つだと思います。 データ分析の解釈や分析結果の報告書などに用いられる「統計的有意」という言葉。データ分析が身近になる中で、「統計的有意」がどのような考え方に基づくものか、またどのように算出されるのか疑問を抱く方もいるかと思います。今回はこの「統計的有意」について、関連する用語とともにz検定を用いて解説します。
母集団と標本
はじめに、データを収集するための調査は全数調査と標本調査に分けることができます。知りたいことの対象者全体を母集団といい、母集団全体について調査することを全数調査、その一部を調査することを標本調査といいます。例えば、自社の営業社員(500人)がどういったパーソナリティなのかを知りたいけれど、期間やコスト面から一部の営業社員(100人)にのみパーソナリティ検査OPQを実施する場合は、標本調査となります。全営業社員が母集団、データ収集を行った一部の営業社員が標本といえます。
統計的推定
次に、統計的推定が何かを知っておきましょう。統計的推定とは、母集団のある値(平均値や標準偏差など)を、標本を用いて推定することを指します。標本である100人の営業社員のOPQデータを集計し、「ヴァイタリティ」尺度の平均値が7.016であったとすると、全営業社員の平均(母集団平均)が、標本から7.016と推定されたということになるのです。統計的検定
統計的検定とは母集団に関する予想(「集団Aの平均<集団Bの平均」など)が、正しいといえるかどうかを標本から判断することを指します。例えば、全営業社員(母集団)の「ヴァイタリティ」平均は、比較対象集団の平均より高いという予想を100人の標本から正しいといえるかどうかを判断します。点推定と区間推定
点推定とは、一つの値で母集団の平均などを推定することを指します。上記では全営業社員の「ヴァイタリティ」の平均値は、7.016であると100人の標本から推定していました。点推定は、標本の人数を多くすれば、推定の精度は上がりますが、母集団のものと完全に一致するという可能性は低いです。そこで、その推定がどの程度正しいかを示す指標として標準誤差があります。標準偏差と標準誤差は異なるものです。標準偏差は標本分布のばらつきを示しますが、標準誤差は標本から得られる標本平均(ここでは100人の「ヴァイタリティ」の平均値7.016)のばらつきの大きさを示します。区間推定とは、一つの値ではなく、区間で母集団の平均などを推定することを指します。推定する区間を信頼区間といい、母集団の平均などが信頼区間に含まれる確率を信頼係数といいます。「95%信頼区間」が一般的に用いられることが多いですが、「母集団から100回標本をとりだし、それぞれ母集団の平均の95%信頼区間を求めた場合、95回程度はその区間内に母集団の平均が入る」ことを指します。100人の標本平均が7.016、標準偏差が1.918だった場合、全営業社員の平均(母集団平均)の95%信頼区間は6.64~ 7.392となります。

統計的検定における帰無仮説と対立仮説
帰無仮説は予想が正しいことを主張するために否定したい前提(対立仮説を否定する内容)です。対立仮説は予想している内容、主張したい内容です。例えば、全営業社員の「ヴァイタリティ」平均値が比較対象集団よりも高いと予想している場合は下記の仮説となります。- 帰無仮説:
- 全営業社員の「ヴァイタリティ」平均値は比較対象集団と同じである
- 対立仮説:
- 全営業社員の「ヴァイタリティ」平均値は比較対象集団と同じでない(差がある)
100人の標本平均が帰無仮説のもとでは5%以下の確率でしか生じない大きな値(あるいは小さな値)の場合、帰無仮説は棄却され、対立仮説が採択されます。これが「統計的に有意に差がある」の考え方になります。
z検定
最後に、z検定を用いて理解していきましょう。OPQ得点は大規模な受検者集団で標準化された得点であり、既に母集団(=一般集団)の平均と標準偏差が分かっている分布となります(平均5.5 標準偏差2)。当社ではこの一般集団を比較対象集団として、その平均と標本の平均との差に統計的に意味があるかどうかを検定する方法をz検定としています。全営業社員の標本100人がその母集団(=一般集団)からランダム抽出された集団であれば、下記のような信頼区間となるはずですが、標本平均は7.016ですので、5%よりもずっと低い確率でしか得られない大きな平均値(誤差で生じたとは考えにくい平均値)であると考えられます。よって、全営業社員の「ヴァイタリティ」平均値は5.5である(比較対象集団と同じである)という帰無仮説は棄却され、全営業社員の「ヴァイタリティ」平均値は.比較対象集団と同じでないという対立仮説が採択されることになります。つまり『全営業社員の「ヴァイタリティ」平均値は一般集団よりも統計的に有意に高く、特徴的である』といえるのです。

イメージを捉えるために信頼区間から考えると上記のようになりますが、実際の検定統計量の計算としては下記になります。

このz値が正規分布表の5%棄却域の値(両側検定の場合2.5%で1.96)よりも大きいかどうかによって帰無仮説を棄却するかを判断します。
以上が「統計的有意」の考え方であり、計算の仕方となります。
おわりに
いざ調査、分析、解釈では、「人数が多いと統計的有意になりやすいとは?」「5%有意とは?」等、さまざまな疑問がわいてくると思いますが、疑問解消の参考となれば幸いです。参考図書:岡太彬訓・都築誉史・山口和範 (1995) データ分析のための統計入門 共立出版