5.5 データ生成(GAN、Diffusion、NeRFなど)

G検定

ディープラーニングは「認識」だけでなく、「生成」分野でも大きな進歩を遂げています。
画像、音声、動画、3Dモデルの生成は、エンタメから医療、シミュレーションまで幅広く活用されています。
本節では代表的な生成モデルとして GAN・拡散モデル・NeRF を整理します。


GAN(Generative Adversarial Networks)

特徴

  • 2014年、Ian Goodfellowらが提案。
  • 生成モデル(Generator)と識別モデル(Discriminator)を競わせて学習。

仕組み

  • Generator:ランダムノイズから本物そっくりのデータを生成。
  • Discriminator:入力が本物か偽物かを判定。
  • 両者を競わせることで生成精度が向上。

応用

  • 画像生成(人物・風景)
  • 画像補完(塗りつぶし、修復)
  • データ拡張

👉 試験頻出:「GANは生成器と識別器を競わせるモデル」。


Diffusion Models(拡散モデル)

背景

  • GANの課題(学習不安定、モード崩壊)を克服する新しい生成モデル。
  • Stable Diffusion、DALL·E 2 などが代表例。

特徴

  • 画像にノイズを段階的に加え、逆にノイズを除去する過程を学習。
  • 高品質かつ多様な画像生成が可能。

成果

  • 2022年以降、画像生成AIの主流となる。
  • テキストからの画像生成(Text-to-Image)が広く普及。

👉 試験ポイント:「拡散モデルはノイズ除去過程を学習してデータを生成する」。


NeRF(Neural Radiance Fields)

特徴

  • 2020年、Googleが提案。
  • ニューラルネットワークで3Dシーンを表現し、任意の視点から画像を生成。

技術

  • 2D画像の集合から3D表現を学習。
  • ボリュームレンダリングとニューラルネットワークを組み合わせ。

応用

  • VR/ARでの3D再現
  • 映画・ゲームのシーン生成
  • 不動産や観光業でのバーチャルツアー

👉 試験ポイント:「NeRFは2D画像から3Dシーンを再構築する技術」。


まとめ

  • GAN:生成器と識別器を競わせる。高精度な画像生成。
  • Diffusion Models:ノイズ除去過程を学習、高品質・多様な画像生成。
  • NeRF:2D画像から3Dシーンを再構築、VR/AR応用。

出題傾向

  • 「GANの仕組みは?」=生成器と識別器を競わせる
  • 「拡散モデルの特徴は?」=ノイズ除去過程を学習
  • 「NeRFの応用分野は?」=3D再構築、VR/AR

練習問題(例題)

問題:次のうち、ノイズを加えたデータからノイズ除去過程を学習し、高品質なデータを生成するモデルはどれか?

  1. GAN
  2. Diffusion Models
  3. NeRF
  4. RNN

👉 正解:2

タイトルとURLをコピーしました