因子分析とは?潜在因子を抽出してデータの構造を解明する手法を解説
因子分析は多数の観測変数の背後にある少数の潜在因子を抽出する多変量解析手法です。因子負荷量の解釈、回転法の選び方、探索的・確認的因子分析の違い、ビジネスでの活用法を解説します。
因子分析とは
因子分析(Factor Analysis)とは、多数の観測変数の相関関係を分析し、その背後に潜む少数の潜在因子(共通因子)を抽出する多変量解析手法です。1904年にチャールズ・スピアマンが知能の研究で提唱した手法であり、心理学・教育学を起点に、現在ではマーケティング、経営学、社会調査など幅広い領域で活用されています。
たとえば、顧客満足度調査で「操作のしやすさ」「処理速度」「機能の充実度」「セキュリティ」「導入実績」という5つの質問項目があるとします。これらの項目間の相関を分析すると、「操作のしやすさ」「処理速度」「機能の充実度」は互いに高い相関を示し、「セキュリティ」「導入実績」も互いに高い相関を持つことがわかるかもしれません。因子分析は、前者の背後に「利便性」という因子、後者の背後に「信頼性」という因子が存在すると推定します。
因子分析の最大の特徴は、観測できない潜在的な構造を統計的に推定する点にあります。観測変数が因子によって生成されるというモデルを仮定し、各変数に固有の誤差(独自性)も考慮します。
構成要素
共通因子と独自因子
因子分析のモデルは、各観測変数を「共通因子」と「独自因子」の2つの要素で説明します。共通因子は複数の観測変数に共通して影響を与える潜在的な要因であり、独自因子はその変数にのみ影響する固有の要素(測定誤差を含む)です。
たとえば、「操作のしやすさ」というアンケート項目の回答は、「利便性」という共通因子の影響と、その項目に固有の測定誤差(独自因子)の合計として表現されます。
因子負荷量
因子負荷量(Factor Loading)は、各観測変数と各因子の関連の強さを示す値です。値の範囲は-1から+1で、絶対値が大きいほどその因子との関連が強いことを意味します。
| 因子負荷量の絶対値 | 解釈 |
|---|---|
| 0.70以上 | その因子と強い関連がある |
| 0.40〜0.69 | 中程度の関連がある |
| 0.40未満 | 関連が弱く、その因子ではうまく説明できない |
因子負荷量のパターンを読み解くことが、因子に意味のある名前を付ける(因子の命名)ための基盤となります。
因子の回転
初期の因子抽出結果は解釈しにくい場合が多いため、因子の回転を行って解釈性を高めます。回転には大きく2種類があります。
| 回転法 | 特徴 | 代表的な手法 |
|---|---|---|
| 直交回転 | 因子間の相関をゼロに保つ(因子同士は無相関) | バリマックス回転 |
| 斜交回転 | 因子間の相関を許容する(因子同士が相関してもよい) | プロマックス回転 |
実務的には、心理学的な構成概念や顧客の価値観など、因子同士がある程度相関していると考えるのが自然な場面が多いため、斜交回転(プロマックス回転)が選択されることが多くなっています。
共通性と独自性
共通性(Communality)は、各観測変数の分散のうち共通因子によって説明される割合です。共通性が高い変数ほど、因子分析のモデルでよく説明できている変数です。一方、独自性(Uniqueness)は共通性の補数(1 - 共通性)であり、因子では説明できない部分を表します。
共通性が極端に低い変数(例: 0.20未満)は、どの因子にも十分に関連しておらず、分析から除外を検討する候補となります。
実践的な使い方
ステップ1: データの適合性を確認する
因子分析を適用する前に、データが因子分析に適しているかを確認します。KMO検定(Kaiser-Meyer-Olkin検定)の値が0.60以上であること、バートレットの球面性検定が有意であることが最低限の基準です。変数間に十分な相関がなければ、因子を抽出する意味がありません。
ステップ2: 因子数を決定する
因子数の決定には複数の基準を組み合わせて判断します。固有値1以上の因子を採用するカイザー基準、スクリープロットの「肘」の位置を確認する方法、平行分析(ランダムデータとの比較)による方法があります。単一の基準に依存せず、理論的な妥当性も考慮して総合的に判断してください。
ステップ3: 因子を抽出し回転を行う
因子抽出法には最尤法、主因子法などがあります。正規分布を仮定できるデータであれば最尤法が推奨されます。抽出後に回転(バリマックスまたはプロマックス)を適用し、因子負荷量の解釈性を高めます。
ステップ4: 因子負荷量を解釈し命名する
回転後の因子負荷量パターンを確認し、各因子に高い負荷量を示す変数群を特定します。その変数群の共通点からビジネス上の意味を見出し、因子に適切な名前を付けます。たとえば、「配送の速さ」「在庫の豊富さ」「注文のしやすさ」が高い負荷量を持つ因子を「購買利便性」と命名するような作業です。
ステップ5: 因子得点を算出し後続分析に活用する
各データポイント(個体)について因子得点を算出し、クラスター分析のインプットや回帰分析の説明変数として活用します。因子得点を用いることで、多数の変数を少数の意味のある軸に集約した状態で分析を進められます。
活用場面
- 顧客満足度調査の構造分析: 数十項目のアンケートを「品質」「価格」「サービス」など少数の因子に集約し、満足度を構造的に把握します
- ブランドイメージの解明: ブランドに対する多数の印象評価項目から「高級感」「親しみやすさ」「革新性」といった潜在的なイメージ因子を抽出します
- 従業員エンゲージメント調査: 職場環境、上司との関係、成長機会など多岐にわたる質問項目から、エンゲージメントを構成する主要因子を特定します
- 商品開発における価値構造の把握: 消費者が商品に求める価値を因子分析で構造化し、開発の優先順位づけに活用します
- 心理尺度の妥当性検証: 新しく開発した測定尺度が意図した構成概念を適切に測定しているかを確認的因子分析で検証します
注意点
探索的因子分析と確認的因子分析を区別する
探索的因子分析(EFA)はデータから因子構造を発見する手法で、仮説がない段階で使用します。確認的因子分析(CFA)は事前に想定した因子構造をデータが支持するかを検証する手法です。探索段階と検証段階では異なるデータセットを用いることが望ましく、同じデータでEFAを行い、その結果をCFAで「検証」しても統計的に意味のある検証にはなりません。
サンプルサイズに注意する
因子分析にはある程度のサンプルサイズが必要です。一般的な目安として、変数の5〜10倍以上のサンプルサイズ、もしくは最低でも100〜200件のデータが推奨されます。サンプルサイズが不足すると因子負荷量の推定が不安定になり、再現性のない因子構造が得られるリスクがあります。
主成分分析との混同を避ける
因子分析とPCA(主成分分析)はいずれも変数を集約する手法ですが、目的とモデルが根本的に異なります。PCAはデータの分散を最大限に保持する次元削減手法であり、誤差を仮定しません。因子分析は潜在因子が観測変数を生成するという因果モデルを仮定し、独自性(誤差)を明示的に組み込みます。理論的に想定される潜在構造を検証したい場合は因子分析、データの要約・前処理が目的であればPCAを選択してください。
因子の命名に恣意性が入りやすい
因子への命名は分析者の解釈に依存するため、客観性を担保する工夫が必要です。複数の分析者で独立に命名を行い結果を照合する、因子負荷量の数値的根拠を明示する、先行研究との整合性を確認するなど、命名の妥当性を支える手順を設けてください。
まとめ
因子分析は、多数の観測変数の背後にある潜在的な構造を統計的に推定する手法です。因子負荷量を手がかりに潜在因子を解釈・命名し、顧客調査やブランド分析、従業員調査など幅広い場面で「データの背後にある本質」を可視化できます。KMO検定による適合性確認、適切な因子数の決定、回転法の選択、十分なサンプルサイズの確保を実践し、PCAとの使い分けを意識することで、分析の信頼性と実務的な有用性を高めることができます。
参考資料
- 因子分析 - グロービス経営大学院(MBA用語集。因子分析の基本概念とビジネスにおける位置づけを解説)
- 因子分析とは?考え方や位置づけ、活用法を解説 - インテージ(マーケティングリサーチの実務的な視点から因子分析の考え方と活用法を解説)
- 因子分析のメリットや結果の見方を具体例から解説 - NTTコム オンライン(因子分析の手順、因子負荷量の読み方、ビジネスでの活用例を具体的に解説)
- 因子分析 - マクロミル(マーケティングリサーチにおける因子分析の位置づけと活用方法を解説)