逆確率重み付け法(IPW)とは?観察データで因果効果を推定する手法を解説
逆確率重み付け法(IPW)は、傾向スコアの逆数を重みとして使い、観察データからセレクションバイアスを除去して因果効果を推定する統計手法です。推定手順、安定化重み、活用場面と注意点を解説します。
逆確率重み付け法とは
逆確率重み付け法(IPW: Inverse Probability Weighting)は、処置を受ける確率(傾向スコア)の逆数を各観測値に重みとして付与することで、擬似的にランダム化された状態を再現し、因果効果を推定する統計手法です。
観察データでは処置の割当がランダムでないため、処置群と対照群の共変量分布が異なります。IPWはこの不均衡を重み付けによって補正し、あたかもランダム化比較試験(RCT)のような共変量バランスを達成します。
IPWの理論的基礎はJames Robinsが1986年に生存分析の文脈で確立しました。その後、疫学、経済学、マーケティングなど幅広い分野で標準的な因果推論手法として普及しています。
IPWの直感的な理解は「少数派を重く数える」ことです。処置を受けにくい属性なのに処置を受けた人は、同じ属性の多くの人を代表していると考え、大きな重みを付けます。これにより、処置群と対照群の属性分布が揃います。
構成要素
Horvitz-Thompson推定量
IPWの基本となる推定量です。処置群の各観測値を傾向スコアの逆数で重み付けし、対照群の各観測値を(1-傾向スコア)の逆数で重み付けします。
| 推定対象 | 重み(処置群) | 重み(対照群) |
|---|---|---|
| ATE | 1/e(X) | 1/(1-e(X)) |
| ATT | 1 | e(X)/(1-e(X)) |
安定化重み
Horvitz-Thompson推定量は傾向スコアが極端な値のときに重みが非常に大きくなり、推定が不安定になります。安定化重みは分子に処置確率の周辺確率を置くことで、重みの変動を抑制します。
共変量バランスの確認
IPWが正しく機能しているかを確認するため、重み付け後の処置群と対照群で共変量の分布が均衡しているかを検証します。標準化平均差(SMD)が0.1未満であることが一般的な基準です。
実践的な使い方
ステップ1: 傾向スコアの推定
処置変数を目的変数、共変量を説明変数としてロジスティック回帰やGBMで傾向スコアを推定します。処置割当のメカニズムに関する知識を活用して共変量を選択します。
ステップ2: 重みの計算と診断
推定された傾向スコアから各観測値のIPW重みを算出します。重みの分布を確認し、極端に大きな重み(たとえば上位1%)が存在しないかチェックします。
ステップ3: 共変量バランスの確認
重み付け前後で標準化平均差を比較し、バランスが改善しているかを検証します。バランスが不十分な場合は傾向スコアモデルを修正します。
ステップ4: 因果効果の推定と推論
重み付き回帰分析またはHorvitz-Thompson推定量で因果効果を推定します。標準誤差はサンドイッチ推定量またはブートストラップ法で算出します。
活用場面
- マーケティング施策(メール配信、クーポン付与など)の因果効果を観察データから推定する場面
- 医療データにおいて処置選択が患者特性に依存する場合の治療効果評価
- 脱落(Attrition)が非ランダムに生じるパネルデータの分析補正
- 教育プログラムの効果を、参加の自己選択バイアスを補正して推定する場面
注意点
IPW適用後は必ず共変量バランスを確認してください。標準化平均差(SMD)が全共変量で0.1未満であれば良好なバランスです。バランスが達成されていない場合は、傾向スコアモデルの仕様を見直す必要があります。
傾向スコアの推定精度への依存
IPWの品質は傾向スコアモデルの精度に強く依存します。傾向スコアに含めるべき共変量が不足している場合(未観測の交絡因子がある場合)、バイアスは除去されません。処置割当メカニズムに関するドメイン知識を活用し、必要な共変量を漏れなく含めることが重要です。
極端な重みによる推定の不安定性
傾向スコアが0や1に近い観測値は非常に大きな重みを持ち、推定量の分散を大幅に増加させます。重みのトリミング(上下限の設定)やウィンザライゼーションによる対処が一般的ですが、これは推定対象の母集団を暗黙的に変えることを意味します。トリミングの基準と影響を明示的に報告してください。
ポジティビティ仮定の違反
すべての共変量の値に対して処置を受ける確率が0より大きく1より小さいこと(ポジティビティ仮定)が必要です。特定の属性グループが決して処置を受けない(または必ず受ける)場合、そのグループに対する因果効果はIPWでは推定できません。
まとめ
逆確率重み付け法は、傾向スコアの逆数を重みとして使い、観察データからセレクションバイアスを除去する因果推論手法です。共変量バランスの達成状況を必ず確認し、極端な重みへの対処を行うことが実務上重要です。より頑健な推定が必要な場合は二重にロバストな推定(AIPW)との組み合わせを検討しましょう。