データインピュテーションは欠損値を統計的・機械学習的手法で補完する技術です。欠損メカニズムの分類、主要な補完手法、選択基準、注意点を体系的に解説します。
特徴量エンジニアリングは機械学習モデルの予測精度を左右する最重要工程です。生データから有効な特徴量を生成・選択するプロセス、代表的な手法、ドメイン知識の活かし方を解説します。