正規性検定とは?シャピロ・ウィルク検定やQ-Qプロットでデータの正規性を確認する方法を解説
正規性検定はデータが正規分布に従うかを統計的に評価する手法です。シャピロ・ウィルク検定、コルモゴロフ・スミルノフ検定、Q-Qプロットの使い方と解釈、ビジネス活用場面と注意点を解説します。
正規性検定とは
正規性検定(normality test)とは、データが正規分布に従っているかどうかを統計的に評価する手法です。t検定、分散分析(ANOVA)、線形回帰分析などのパラメトリック手法は、データまたは残差が正規分布に従うことを前提としています。この前提が満たされているかを確認するのが正規性検定の役割です。
代表的な手法であるシャピロ・ウィルク検定は、1965年にサミュエル・シャピロとマーティン・ウィルクによって提案されました。コルモゴロフ・スミルノフ検定は、ロシアの数学者アンドレイ・コルモゴロフとニコライ・スミルノフの研究に基づいています。
正規性の確認は、パラメトリック検定を使うかノンパラメトリック検定に切り替えるかの判断基準になります。正規性が確認できればパラメトリック検定で高い検出力を得られ、確認できなければノンパラメトリック検定で頑健な分析を行えます。
コンサルティングの現場では、分析結果の信頼性を担保するために正規性の確認は不可欠なステップです。ただし、正規性検定は「完全に正規か」を問うのではなく、「パラメトリック手法を適用しても十分に信頼できるか」を判断するための材料として使います。
構成要素
シャピロ・ウィルク検定
最も検出力が高いとされる正規性検定です。サンプルサイズが50以下の場合に特に推奨されます。W統計量は0から1の範囲をとり、1に近いほど正規分布に近いことを示します。
帰無仮説は「データは正規分布に従う」です。p値が有意水準(通常0.05)を下回れば正規性を棄却します。
コルモゴロフ・スミルノフ検定(KS検定)
データの経験分布関数と理論分布の最大偏差を検定統計量とする手法です。任意の分布との適合を検定でき、正規分布以外にも使えます。リリーフォース補正版はパラメータを推定した上で正規性を検定します。
シャピロ・ウィルク検定に比べて検出力がやや低いですが、サンプルサイズの制約が少ない利点があります。
ダゴスティーノ・ピアソン検定
歪度と尖度の両方を使って正規性を検定します。分布が正規分布からどの方向に逸脱しているか(左右の歪みか、裾の厚さか)を把握しやすい点が特徴です。
Q-Qプロット(分位数-分位数プロット)
データの分位数を理論正規分布の分位数に対してプロットする視覚的手法です。データが正規分布に従っていれば、点は直線上に並びます。直線から外れるパターンで正規性からの逸脱の種類を読み取れます。
| パターン | 意味 |
|---|---|
| 点が直線上に並ぶ | 正規分布に近い |
| 両端が上に反る | 右裾が重い(正の歪度) |
| 両端が下に反る | 左裾が重い(負の歪度) |
| S字カーブ | 尖度が異なる |
:::box-point 正規性検定は「完全に正規かどうか」を判定するものではなく、「パラメトリック手法を適用して問題ないか」を判断するための材料です。視覚的確認と数値的検定を組み合わせて総合的に判断することが実務では重要です。 :::
実践的な使い方
ステップ1: まず視覚的に確認する
ヒストグラムとQ-Qプロットでデータの分布形状を目視確認します。視覚的な確認は検定以上に実務的な判断の助けになります。
ステップ2: 適切な正規性検定を選ぶ
- サンプルサイズが50以下: シャピロ・ウィルク検定
- サンプルサイズが50超: ダゴスティーノ・ピアソン検定またはKS検定
- 逸脱の方向を知りたい: ダゴスティーノ・ピアソン検定
ステップ3: 検定を実行する
PythonではSciPy(shapiro、normaltest、kstest)、Rではshapiro.test関数が利用できます。
ステップ4: 結果に基づいて分析手法を決定する
正規性が確認できればパラメトリック検定を、棄却されればノンパラメトリック検定を選びます。ただし、サンプルサイズが30以上であれば中心極限定理により平均値の分布はおおむね正規に近づくため、元データの正規性が多少崩れていてもパラメトリック検定は頑健に機能します。
ステップ5: 変換の検討
正規性が満たされない場合、対数変換、平方根変換、Box-Cox変換などでデータを変換してから分析する方法もあります。変換後のデータの正規性を再確認します。
活用場面
- パラメトリック検定の前提確認: t検定やANOVAを実行する前に、データの正規性を確認する標準的なステップとして使います
- 回帰分析の残差診断: 回帰モデルの残差が正規分布に従うかを確認し、モデルの妥当性を評価します
- 品質管理: 製品寸法や性能指標が正規分布に従うかを確認し、管理図の前提を検証します
- データ前処理の判断: 正規性の程度に応じて、変換の必要性や分析手法の選択を判断します
- レポートの信頼性担保: 分析の前提条件を明示的に確認していることを示し、報告の信頼性を高めます
:::box-warning サンプルサイズが数百以上の大標本では、わずかな正規分布からの逸脱でも検定が有意になります。大標本では検定結果だけに頼らず、Q-Qプロットや歪度・尖度の数値的評価を併用して判断してください。 :::
注意点
大標本ではほぼ必ず棄却される
サンプルサイズが数百以上になると、わずかな正規分布からの逸脱でも有意になります。大標本ではQ-Qプロットによる視覚的評価と、歪度・尖度の数値的評価を優先します。
「正規性が棄却されない」は「正規である」の証明ではない
帰無仮説が棄却されなくても、「正規分布に従う」と断言はできません。検出力が不足している(サンプルサイズが小さい)可能性があります。
中心極限定理を活用する
サンプルサイズが30以上の場合、元データの分布に関わらず標本平均は正規分布に近づきます。t検定やANOVAは標本平均に基づく検定であるため、適度なサンプルサイズがあれば多少の正規性の逸脱に対して頑健です。
複数の方法を組み合わせる
正規性の判断は1つの方法だけに頼らず、視覚的確認(ヒストグラム、Q-Qプロット)と数値的検定を組み合わせて総合的に判断します。
まとめ
正規性検定は、パラメトリック手法の前提条件を確認するための基本的なステップです。シャピロ・ウィルク検定やQ-Qプロットを中心に、データの特性とサンプルサイズに応じた方法を選択します。大標本での過剰棄却や中心極限定理による頑健性を理解した上で、形式的な検定結果だけでなく実務的な判断を組み合わせることが、信頼性の高い分析の鍵です。