ディープラーニングは「認識」だけでなく、「生成」分野でも大きな進歩を遂げています。
画像、音声、動画、3Dモデルの生成は、エンタメから医療、シミュレーションまで幅広く活用されています。
本節では代表的な生成モデルとして GAN・拡散モデル・NeRF を整理します。
GAN(Generative Adversarial Networks)
特徴
- 2014年、Ian Goodfellowらが提案。
- 生成モデル(Generator)と識別モデル(Discriminator)を競わせて学習。
仕組み
- Generator:ランダムノイズから本物そっくりのデータを生成。
- Discriminator:入力が本物か偽物かを判定。
- 両者を競わせることで生成精度が向上。
応用
- 画像生成(人物・風景)
- 画像補完(塗りつぶし、修復)
- データ拡張
👉 試験頻出:「GANは生成器と識別器を競わせるモデル」。
Diffusion Models(拡散モデル)
背景
- GANの課題(学習不安定、モード崩壊)を克服する新しい生成モデル。
- Stable Diffusion、DALL·E 2 などが代表例。
特徴
- 画像にノイズを段階的に加え、逆にノイズを除去する過程を学習。
- 高品質かつ多様な画像生成が可能。
成果
- 2022年以降、画像生成AIの主流となる。
- テキストからの画像生成(Text-to-Image)が広く普及。
👉 試験ポイント:「拡散モデルはノイズ除去過程を学習してデータを生成する」。
NeRF(Neural Radiance Fields)
特徴
- 2020年、Googleが提案。
- ニューラルネットワークで3Dシーンを表現し、任意の視点から画像を生成。
技術
- 2D画像の集合から3D表現を学習。
- ボリュームレンダリングとニューラルネットワークを組み合わせ。
応用
- VR/ARでの3D再現
- 映画・ゲームのシーン生成
- 不動産や観光業でのバーチャルツアー
👉 試験ポイント:「NeRFは2D画像から3Dシーンを再構築する技術」。
まとめ
- GAN:生成器と識別器を競わせる。高精度な画像生成。
- Diffusion Models:ノイズ除去過程を学習、高品質・多様な画像生成。
- NeRF:2D画像から3Dシーンを再構築、VR/AR応用。
出題傾向
- 「GANの仕組みは?」=生成器と識別器を競わせる
- 「拡散モデルの特徴は?」=ノイズ除去過程を学習
- 「NeRFの応用分野は?」=3D再構築、VR/AR
練習問題(例題)
問題:次のうち、ノイズを加えたデータからノイズ除去過程を学習し、高品質なデータを生成するモデルはどれか?
- GAN
- Diffusion Models
- NeRF
- RNN
👉 正解:2