差分の差分法(DID)とは?政策効果を自然実験から推定する因果分析手法
差分の差分法(DID)は処置群と対照群の前後変化の差を比較し、因果効果を推定する統計手法です。基本原理、前提条件、実施手順、活用場面、注意点を実践的に解説します。
差分の差分法とは
差分の差分法(DID: Difference-in-Differences)とは、政策やプログラムの効果を推定するための準実験的な統計手法です。ランダム化比較試験(RCT)が実施できない状況で、「介入がなかった場合に何が起きていたか」という反事実(Counterfactual)を構築し、因果効果を識別します。
DIDの基本的なアイデアは、介入を受けた処置群(Treatment Group)と受けなかった対照群(Control Group)の2つのグループについて、介入前後の変化量をそれぞれ計算し、その差分を取ることで因果効果を推定するというものです。「差分の差分」という名称は、時間方向の差分(Before/After)とグループ間の差分(処置群/対照群)の二重の差分を取ることに由来します。
この手法は経済学の分野で発展し、デビッド・カードとアラン・クルーガーによる1994年の最低賃金研究が最も有名な応用事例です。カードはこの業績を含む因果推論への貢献により2021年にノーベル経済学賞を受賞しました。現在では経済学にとどまらず、公衆衛生、教育政策、マーケティング分析など幅広い分野で活用されています。
構成要素
DIDの推定量
DIDの推定量は以下の式で表現されます。
DID推定量 = (Y_処置群_After - Y_処置群_Before) - (Y_対照群_After - Y_対照群_Before)
| 要素 | 定義 | 具体例 |
|---|---|---|
| 処置群(Treatment) | 介入・政策の対象となったグループ | 最低賃金が引き上げられた州 |
| 対照群(Control) | 介入を受けなかった比較グループ | 最低賃金が変更されなかった隣接州 |
| Before期間 | 介入実施前の観察期間 | 政策施行前の半年間 |
| After期間 | 介入実施後の観察期間 | 政策施行後の半年間 |
平行トレンド仮定
DIDの妥当性は「平行トレンド仮定(Parallel Trends Assumption)」に大きく依存します。これは「介入がなかった場合、処置群と対照群は同じトレンドで変化していただろう」という仮定です。この仮定が成立しなければ、DIDの推定量は因果効果を正しく反映しません。
平行トレンド仮定は介入前のデータを使って間接的に検証します。介入前の複数時点で両群のトレンドが平行であることを確認する「プレトレンドテスト」が標準的な検証方法です。
回帰分析による実装
DIDは回帰分析のフレームワークで実装するのが一般的です。アウトカム変数を被説明変数とし、処置群ダミー、介入後ダミー、そしてこれらの交差項(相互作用項)を説明変数とする回帰モデルを推定します。交差項の係数がDID推定量に一致します。この枠組みにより、共変量の統制や標準誤差の計算が容易になります。
実践的な使い方
ステップ1: リサーチデザインを設計する
DIDを適用するための最初のステップは、処置群と対照群の定義、および介入の時点を明確にすることです。理想的な対照群は、介入を受けていないが処置群と類似した特性を持つグループです。地理的な近接性、産業構造の類似性、人口構成の類似性などが対照群選定の基準となります。
介入の時点が明確でない場合(段階的に導入された政策など)は、通常のDIDではなく、段階的DID(Staggered DID)の枠組みを検討します。
ステップ2: 平行トレンド仮定を検証する
データ収集後、介入前の複数時点で処置群と対照群のアウトカムのトレンドを可視化し、平行トレンド仮定の妥当性を確認します。グラフ上で両群のトレンドが並行していれば仮定は支持されますが、乖離が見られる場合はDIDの適用を再検討するか、トレンドの差を統制する手法(例: DIDとマッチングの組み合わせ)を検討します。
イベントスタディ分析(介入時点を基準に各時点のDID推定量を算出するアプローチ)を実施すると、介入前のDID推定量がゼロ付近であることを確認でき、平行トレンド仮定のより厳密な検証が可能になります。
ステップ3: DIDモデルを推定する
回帰分析モデルを構築し、パラメータを推定します。基本モデルに加えて、時間固定効果や個体固定効果を含むパネルデータモデル、共変量を追加したモデルなど、複数の仕様で推定を行い、結果のロバスト性を確認します。
標準誤差の計算には注意が必要です。同じグループ内のデータは時間的に相関している可能性があるため、グループレベルのクラスタリング標準誤差を使用するのが標準的な実務です。
ステップ4: 感度分析と結果の解釈を行う
推定結果の頑健性を確認するために、対照群の変更、分析期間の変更、プラセボテスト(介入がなかった時点で介入があったと仮定して分析する)などの感度分析を実施します。推定結果が分析仕様の変更に対して安定していれば、因果効果の推定値への信頼が高まります。
活用場面
- 政策評価: 税制改革、最低賃金引き上げ、環境規制など、特定の地域や時期に導入された政策の効果を推定します
- マーケティング施策の効果測定: 一部の地域でのみ展開したキャンペーンの売上への影響を、非展開地域との比較で評価します
- 人事施策の評価: 一部の部門に導入したリモートワーク制度が生産性に与えた影響を分析します
- 規制の影響分析: 新規制が導入された業界と非導入業界を比較し、規制の経済的影響を推定します
- M&Aの効果分析: 買収された企業の業績変化を、類似する非買収企業との比較で評価します
注意点
平行トレンド仮定の検証には限界がある
平行トレンド仮定は「介入がなかった場合」の仮想的な状況に関する仮定であり、原理的に直接検証することはできません。介入前のトレンドが平行であっても、介入後も平行であった保証はありません。この限界を認識した上で、複数の感度分析を組み合わせて仮定の妥当性を総合的に判断する必要があります。
処置の波及効果に注意する
DIDは処置群への介入が対照群に影響を与えない(SUTVA: Stable Unit Treatment Value Assumption)ことを前提としています。しかし、近隣地域で実施された政策が対照群の行動にも影響を与える「波及効果(Spillover Effects)」がある場合、DIDの推定量はバイアスを持ちます。
複数時点の処置には追加的な配慮が必要
処置の導入時期が複数のグループで異なる「段階的DID」の場合、従来の二元固定効果モデルは推定にバイアスを生じることが近年の研究で明らかになっています。Callaway and Sant’Anna (2021)やSun and Abraham (2021)が提案した推定手法の適用を検討してください。
まとめ
差分の差分法(DID)は、処置群と対照群の介入前後の変化量の差を比較することで因果効果を推定する手法です。ランダム化が困難な状況でも因果推論を可能にする強力な分析ツールであり、政策評価やマーケティング施策の効果測定に広く活用されています。平行トレンド仮定の検証を丁寧に行い、複数の仕様での感度分析を通じて結果の頑健性を確認することが、信頼性の高い分析の鍵です。