ARIMAモデルとは？自己回帰と移動平均を統合した時系列予測の標準手法

ARIMAモデルとは

ARIMA（Autoregressive Integrated Moving Average）モデルとは、時系列データの予測に用いられる統計モデルで、「自己回帰」（AR: Autoregressive）、「差分」（I: Integrated）、「移動平均」（MA: Moving Average）の3つの成分を統合した手法です。

時系列データには「過去の自分自身の値に依存する」性質（自己相関）があります。ARIMAモデルはこの自己相関構造を体系的にモデル化し、将来の値を予測します。統計学に基づく厳密なモデルであり、予測精度と理論的な解釈性の両方を兼ね備えている点が強みです。

コンサルティングの現場では、売上予測、マクロ経済指標の予測、需要予測など、時系列予測が求められる場面でARIMAモデルが標準的な手法として活用されます。指数平滑法よりも柔軟な時系列構造を表現でき、機械学習モデルよりも解釈性が高いという位置づけです。

ARIMAモデルは、1970年にGeorge E. P. Box（ジョージ・ボックス）とGwilym M. Jenkins（グウィリム・ジェンキンス）が著書「Time Series Analysis: Forecasting and Control」で体系化しました。モデルの構築手順は「Box-Jenkins法」として知られ、時系列分析の標準的なアプローチとして世界中で教育・活用されています。

ARIMAモデルはARIMA(p, d, q)と表記されます。pは自己回帰の次数、dは差分の回数、qは移動平均の次数です。たとえばARIMA(1, 1, 1)は、1次の自己回帰、1回の差分、1次の移動平均を組み合わせたモデルです。この3つのパラメータの適切な選定が、モデルの予測精度を左右します。

構成要素

ARIMAモデルは3つの成分で構成されます。

AR（自己回帰）成分

現在の値が過去の値の線形結合で表されるという仮定です。

パラメータ	意味	例
p = 1	1期前の値に依存	前月の売上が今月に影響
p = 2	2期前までの値に依存	前月と前々月の売上が影響

I（差分）成分

データが非定常（トレンドを持つ）場合に、差分を取って定常化する処理です。

パラメータ	意味	操作
d = 0	差分不要（データが定常）	原系列をそのまま使用
d = 1	1回差分	前期との差を計算
d = 2	2回差分	1回差分の差をさらに計算

MA（移動平均）成分

現在の値が過去の予測誤差（ホワイトノイズ）の線形結合で表されるという仮定です。

パラメータ	意味	効果
q = 1	1期前の予測誤差に依存	短期的なショックの影響を反映
q = 2	2期前までの予測誤差に依存	やや長い期間のショックを反映

SARIMA（季節性ARIMA）

季節性のあるデータには、ARIMAに季節成分を追加したSARIMA(p, d, q)(P, D, Q, m)を使用します。mは季節周期（月次データなら12）です。

実践的な使い方

ステップ1: データを可視化し定常性を確認する

時系列データをプロットし、トレンドや季節性の有無を目視で確認します。さらに、ADF検定（拡大ディッキー・フラー検定）でデータの定常性を統計的に判定します。非定常であれば差分を取り、定常化した上でモデリングに進みます。

ステップ2: 差分の回数（d）を決定する

ADF検定のp値が0.05未満になるまで差分を取ります。多くのビジネスデータではd = 1（1回差分）で定常化できます。d = 2以上が必要な場合は稀であり、データに問題がないか再確認してください。

ステップ3: ACF・PACFからp, qの候補を選定する

自己相関関数（ACF）と偏自己相関関数（PACF）のプロットから、ARとMAの次数の候補を特定します。

プロット	パターン	示唆
ACFが急激に減衰	PACFがp次でカットオフ	AR(p)モデルが適切
PACFが急激に減衰	ACFがq次でカットオフ	MA(q)モデルが適切
両方が徐々に減衰	-	ARMA(p, q)の組み合わせが必要

ステップ4: 情報量基準でモデルを選択する

候補となる複数のモデルを構築し、AIC（赤池情報量基準）やBIC（ベイズ情報量基準）で比較します。AIC / BICが最小のモデルが、予測精度と過学習のバランスが最も良いモデルです。Pythonの auto_arima（pmdarima）を使えば、この探索を自動化できます。

ステップ5: 残差診断でモデルの妥当性を検証する

選択したモデルの残差（予測誤差）が「ホワイトノイズ」（無相関で等分散のランダムな変動）であるかを確認します。残差に自己相関が残っている場合、モデルがデータの構造を十分に捉えきれていないことを示すため、パラメータの見直しが必要です。

活用場面

マクロ経済の予測: GDP、物価、失業率などのマクロ経済指標の予測にARIMAが標準的に使用されます
売上予測: 月次・四半期の売上を予測し、予算計画や生産計画の基礎データを提供します
需要予測: 製品別の需要をARIMAで予測し、在庫管理や調達計画に活用します
金融市場の分析: 株価、為替レート、金利の時系列モデリングにARIMAが活用されます
KPIの異常検知: ARIMAの予測値と実績値の乖離をモニタリングし、異常の早期検知に使用します

注意点

ARIMAモデルは「過去のパターンが将来も継続する」という前提に基づいています。市場環境の構造変化、新技術の登場、規制の変更など、過去にないパターンが生じる場合には予測精度が大きく低下します。予測結果を鵜呑みにせず、外部環境の変化を常に監視してください。

定常性の確保を怠らない

非定常なデータにARIMAを適用すると、見かけ上のフィットは良くても予測精度が著しく悪化します。ADF検定で定常性を必ず確認し、必要な差分処理を行ってからモデリングに進んでください。

パラメータの選定に時間をかけすぎない

ACF・PACFの解釈やAICの比較に過度に時間をかけることは実務的ではありません。auto_arima などの自動選択ツールでベースラインを作り、ドメイン知識で微調整するアプローチが効率的です。

長期予測の精度に過信しない

ARIMAの予測精度は、予測期間が長くなるほど低下します。一般に、データの周期（月次データなら12ヶ月）を超える長期予測は信頼性が低くなります。長期予測が必要な場合は、シナリオ分析と組み合わせて不確実性を明示してください。

まとめ

ARIMAモデルは、自己回帰・差分・移動平均の3成分を統合した時系列予測の標準手法です。Box-Jenkins法に従い、定常性の確認、パラメータの選定、残差診断の3ステップでモデルを構築します。統計的な厳密性と解釈性を兼ね備えた手法ですが、過去パターンの延長であるという限界を理解し、構造変化への注意と長期予測の不確実性の明示を心がけることが、実務で信頼される分析を行う鍵です。

ARIMAモデルとは？自己回帰と移動平均を統合した時系列予測の標準手法