合成データ生成は、元データの統計的特性を保持しつつ個人情報を含まない模擬データを生成する手法です。GAN、変分オートエンコーダ、統計的手法の仕組みと、プライバシー保護・データ拡張での活用法を解説します。
データ拡張は、既存データに変換を加えて学習データ量を疑似的に増やし、モデルの汎化性能を向上させる手法です。画像、テキスト、テーブルデータそれぞれの拡張手法と注意点を解説します。