📈データ分析・定量スキル

ウィルコクソン符号順位検定とは?対応のあるノンパラメトリック検定の手法と使い方を解説

ウィルコクソン符号順位検定は対応のある2群データの差を正規分布の仮定なしに検定する手法です。検定の仕組み、対応ありt検定との使い分け、ビジネスでの活用場面と注意点を解説します。

#ウィルコクソン検定#ノンパラメトリック検定#対応あり#統計検定#データ分析

    ウィルコクソン符号順位検定とは

    ウィルコクソン符号順位検定(Wilcoxon signed-rank test)とは、対応のある2群のデータについて、差の分布が対称にゼロを中心としているかを検定するノンパラメトリック手法です。対応ありt検定の代替として、差の分布が正規分布に従わない場合に使用します。

    「対応のある」とは、同じ対象について2つの条件で測定したデータを意味します。研修前後のスコア、施策導入前と導入後の指標、同一顧客に対する2つの提案の評価など、ペアになったデータが対象です。

    この検定は1945年にフランク・ウィルコクソンが提案しました。符号検定が差の方向のみを使うのに対し、符号順位検定は差の大きさの順位情報も利用するため、検出力が高くなります。

    フランク・ウィルコクソン(Frank Wilcoxon, 1892-1965)は、アメリカの統計学者・化学者です。1945年の論文「Individual Comparisons by Ranking Methods」で符号順位検定と順位和検定の両方を提案しました。農薬メーカーのアメリカン・シアナミッド社で殺虫剤の効果比較に取り組む中で、正規分布を仮定しない実用的な検定手法を開発しました。

    ウィルコクソン符号順位検定の手順

    構成要素

    差の計算と符号

    まず各対の差(d = 後 − 前)を計算します。差がゼロの対は分析から除外します。各差に符号(正または負)を記録します。

    順位付け

    差の絶対値に順位を付けます。絶対値が小さいものから順に1, 2, 3, …と割り当てます。同じ絶対値がある場合は平均順位(タイ処理)を使います。

    W統計量(検定統計量)

    正の差の順位和(W+)と負の差の順位和(W-)を計算し、小さい方をW統計量とします。Wが小さいほど差が一方向に偏っていることを意味します。

    帰無仮説と対立仮説

    • 帰無仮説(H₀): 差の分布はゼロを中心に対称である(中央値がゼロ)
    • 対立仮説(H₁): 差の分布はゼロを中心に対称ではない(両側検定の場合)

    サンプルサイズが25以上の場合は正規近似でp値を算出し、それ未満では正確分布表を使用します。

    実践的な使い方

    ステップ1: 対応ありt検定との使い分けを判断する

    差のデータの正規性を確認します。正規Q-Qプロットやシャピロ・ウィルク検定で正規性が疑われる場合、ウィルコクソン符号順位検定を選びます。正規性が確認できれば対応ありt検定の方が検出力が高くなります。

    ステップ2: 対の差を計算する

    各対について差を算出し、差がゼロの対を除外します。除外した対の数も報告します。

    ステップ3: 差の絶対値に順位を付ける

    差の絶対値を昇順に並べ、順位を付けます。同順位はタイ処理で対応します。

    ステップ4: W統計量とp値を算出する

    PythonではSciPy(scipy.stats.wilcoxon)、RではWilcox.test(paired=TRUE)で計算できます。

    ステップ5: 効果量を報告する

    r = z/√N で効果量を算出します。「研修後のスコアは研修前より有意に高くなった(W=45, p=0.012, r=0.38)」のように報告します。

    活用場面

    • 研修効果の測定: 同一の受講者について研修前後のスコア変化を検証します。スコアが正規分布に従わない場合に適しています
    • 施策のビフォーアフター分析: 施策導入前後の指標変化を対のデータとして検定します
    • 顧客評価の比較: 同一顧客に2つの提案や製品を評価してもらい、評価の偏りを検定します
    • UI改善の効果測定: 同一ユーザーが新旧のUIを使用した際のタスク完了時間を比較します
    • 季節変動の確認: 同一店舗の前年同月比など、対になったデータの変化を検定します

    注意点

    ウィルコクソン符号順位検定は「差の分布がゼロに対して対称である」ことを前提としています。差の分布が強く歪んでいる場合は、前提が満たされないため、符号検定など別の手法を検討してください。

    差がゼロの対の扱い

    差がゼロの対は除外されるため、有効サンプルサイズが減少します。差がゼロの対が多い場合は検出力が低下するため、測定精度の向上や、符号検定の併用を検討します。

    差の分布の対称性が前提

    ウィルコクソン符号順位検定は「差の分布がゼロに対して対称」を前提とします。差の分布が強く歪んでいる場合は、符号検定(差の方向のみを使う、より仮定の弱い検定)を選択肢に入れます。

    マン・ホイットニーU検定との混同に注意

    ウィルコクソンの名前が付く検定は2つあります。ウィルコクソン符号順位検定は対応ありデータ用、ウィルコクソン順位和検定(マン・ホイットニーU検定と等価)は独立2群用です。分析目的に合った方を選びます。

    サンプルサイズが極端に小さいと検出力が不足する

    対の数が10未満の場合、有意な差を検出する能力が著しく低下します。有意でない結果が「差がない」ことの証拠にはならないことを認識し、サンプルサイズの制約を報告書に明記します。

    まとめ

    ウィルコクソン符号順位検定は、対応のある2群データの差を正規分布の仮定なしに検定するノンパラメトリック手法です。差の符号と順位の両方を利用することで、符号検定より高い検出力を実現します。対応ありt検定との使い分けを理解し、差がゼロの対の扱いや対称性の前提を認識した上で使用することで、前後比較の場面で信頼性の高い分析が可能になります。

    関連記事