合成コントロール法とは?比較対象を統計的に構築し政策効果を評価する手法
合成コントロール法は複数の非処置ユニットの重み付け平均で反事実を構築し、因果効果を推定する統計手法です。基本原理、実施手順、DIDとの比較、活用場面、注意点を実践的に解説します。
合成コントロール法とは
合成コントロール法(Synthetic Control Method: SCM)とは、政策やイベントの因果効果を推定するために、介入を受けなかった複数のユニット(ドナープール)の重み付け平均を使って「介入がなかった場合の処置ユニットの姿」(合成コントロール)を統計的に構築する手法です。スタンフォード大学のアルベルト・アバディとハビエル・ガルデアサバルが2003年に発表し、アバディ、ダイアモンド、ハイネミュラーの2010年の論文で精緻化されました。
この手法の画期的な点は、適切な比較対象(コントロール群)が存在しない状況でも、複数の候補からデータドリブンに比較対象を「合成」できることにあります。たとえば、ある国が特定の経済政策を実施した効果を評価したい場合、まったく同じ条件の別の国は存在しません。しかし、複数の国のデータを適切に重み付けして組み合わせることで、「その国が政策を実施しなかった場合にどうなっていたか」を推定する反事実(Counterfactual)を構築できます。
アバディらの代表的な応用事例は、1988年にカリフォルニア州が導入した大規模なたばこ規制プログラム(Proposition 99)の効果分析です。他の米国州の重み付け平均で「合成カリフォルニア」を構築し、実際のカリフォルニアとの差分からプログラムの効果(一人あたりたばこ消費量の減少)を推定しました。
構成要素
基本的な構造
合成コントロール法の構成要素は以下の通りです。
| 要素 | 定義 | 具体例 |
|---|---|---|
| 処置ユニット | 介入を受けた対象(通常1つ) | 政策を導入した州・国・都市 |
| ドナープール | 介入を受けなかった候補ユニットの集合 | 政策を導入しなかった他の州 |
| 重みベクトル | 各ドナーユニットの重み(非負、合計1) | w_A=0.35, w_B=0.25, … |
| 予測変数 | 重みの最適化に使用する変数群 | 介入前のアウトカム、共変量 |
| 介入前期間 | 重みの推定と適合度確認に使用する期間 | 政策導入前の10年間 |
| 介入後期間 | 効果を測定する期間 | 政策導入後の期間 |
重みの最適化
合成コントロール法の核心は、ドナープールの重みをどう決定するかです。重みは、介入前期間において合成コントロールと処置ユニットの予測変数が可能な限り一致するように最適化されます。この最適化は制約付き最小化問題として定式化されます。重みは非負制約(w_i >= 0)と合計1制約(合計w_i = 1)を持ち、これにより合成コントロールがドナープールの凸結合として構築されることが保証されます。
DIDとの比較
合成コントロール法は差分の差分法(DID)と同じく準実験的な因果推論手法ですが、重要な違いがあります。DIDはすべての対照群に等しい重みを与えますが、SCMはデータドリブンに最適な重みを決定します。DIDは平行トレンド仮定を前提としますが、SCMは介入前のレベルとトレンドの両方を一致させることで、より柔軟に反事実を構築できます。ただし、SCMは通常1つの処置ユニットを分析するため、標準的な統計的推論が困難という課題があります。
実践的な使い方
ステップ1: 処置ユニットとドナープールを定義する
合成コントロール法を適用するための最初のステップは、処置ユニットとドナープールの定義です。処置ユニットは、分析対象となる介入を受けたユニット(州、国、企業など)です。ドナープールは、介入を受けておらず、処置ユニットと類似した特性を持つユニットの集合です。
ドナープール選定の基準は、処置ユニットと類似した構造的特性を持つこと、分析期間中に類似の介入を受けていないこと、介入による波及効果を受けていないこと、十分な長さの介入前データが利用可能であることです。ドナープールに不適切なユニットが含まれると、合成コントロールの品質が低下するため、実質的な知識に基づいた事前スクリーニングが重要です。
ステップ2: 予測変数を選定する
重みの最適化に使用する予測変数を選定します。予測変数には、介入前のアウトカム変数の時系列値、およびアウトカムに影響を与える共変量(経済指標、人口構成、制度変数など)が含まれます。
介入前のアウトカム変数を予測変数に含めることで、観察されない交絡要因を間接的に統制する効果が期待できます。これは「介入前のアウトカムが一致していれば、観察されない要因も概ね一致しているだろう」という論理に基づいています。
ステップ3: 合成コントロールを構築し適合度を確認する
最適化アルゴリズムを実行し、ドナープールの重みを推定します。推定された合成コントロールが、介入前期間において処置ユニットのアウトカムをどの程度再現できているかを確認します。介入前の適合度が低い場合(合成コントロールと処置ユニットの乖離が大きい場合)、推定結果の信頼性は低くなります。
適合度は、介入前期間のRMSPE(Root Mean Squared Prediction Error)で定量的に評価します。グラフ上で合成コントロールと処置ユニットの軌跡を重ねて視覚的にも確認することが重要です。
ステップ4: 効果を推定しプラセボテストで検証する
介入後期間における処置ユニットと合成コントロールの差が、推定される因果効果です。しかし、この差が統計的に有意かどうかの判定は、通常の統計検定とは異なるアプローチを取ります。
最も一般的な検証方法はプラセボテスト(Placebo Test)です。ドナープール内の各ユニットに対して同じ手法を適用し(各ユニットが処置を受けたと仮定して合成コントロールを構築し)、プラセボ効果の分布を生成します。処置ユニットの推定効果がプラセボ効果の分布の中で極端な値を取っていれば、効果が有意であると判断します。
活用場面
- 地域政策の効果評価: 特定の州や都市が導入した政策(最低賃金引き上げ、規制緩和、税制改革)の効果を、他の地域との比較で評価します
- 企業の戦略変更の効果分析: M&A、大規模投資、事業モデル転換などの戦略的意思決定が業績に与えた影響を推定します
- 自然災害やパンデミックの経済影響: 特定の地域が受けた外生的ショックの経済的影響を定量化します
- 規制の影響分析: 金融規制、環境規制、労働規制の導入が対象産業に与えた影響を評価します
- 国際比較分析: ある国の固有の政策や制度が経済パフォーマンスに与えた影響を、他国の組み合わせとの比較で推定します
注意点
ドナープールの外挿問題
処置ユニットの特性がドナープールのユニットの凸結合では再現できない場合(つまり、処置ユニットがドナープールの凸包の外にある場合)、合成コントロール法は適切な反事実を構築できません。たとえば、処置ユニットが非常に大規模な経済体であり、ドナープール内にそれに匹敵するユニットがない場合がこれに該当します。
介入前の適合度への過信
介入前の適合度が高いからといって、介入後の反事実も正確に推定されているとは限りません。適合度が高いのは「過学習」の結果かもしれず、特にドナープールのユニット数が多い場合に注意が必要です。少数のドナーユニットに重みが集中しているか、多数のユニットに分散しているかを確認し、合成コントロールの構成が実質的に解釈可能であるかを検討します。
推論の限界
合成コントロール法は通常、単一の処置ユニットを分析するため、標準誤差や信頼区間の算出に伝統的な統計理論が適用できません。プラセボテストに基づく推論は有効ですが、ドナープールのサイズが小さい場合、p値の分解能が粗くなるという限界があります。近年は、コンフォーマル推論などの新しいアプローチも提案されています。
介入の波及効果
処置ユニットへの介入がドナープール内のユニットにも影響を与える(波及効果がある)場合、合成コントロールはバイアスを持ちます。地理的に近い地域間での政策評価や、経済的な相互依存関係が強いユニット間の分析では、波及効果の有無を慎重に検討する必要があります。
まとめ
合成コントロール法は、介入を受けなかった複数のユニットの重み付け平均によって反事実を構築し、因果効果を推定する手法です。適切な比較対象が存在しない状況でもデータドリブンに比較対象を合成できる点が最大の強みであり、政策評価、企業戦略の効果分析、規制影響分析など幅広い分野で活用されています。介入前の適合度確認とプラセボテストによる検証を丁寧に行うことが、信頼性の高い分析の基盤です。