Generativní model

Generativní model je typ statistického modelu, který se používá k popisu toho, jak byla data vygenerována. Jeho hlavním úkolem je naučit se vnitřní rozdělení pravděpodobnosti trénovací sady natolik dobře, aby byl schopen vytvářet nové vzorky, které mají stejné vlastnosti jako původní data.

Pokud diskriminační model odpovídá na otázku: „Patří tento obrázek do kategorie kočka?“, generativní model odpovídá na otázku: „Vygeneruj mi nový obrázek, který vypadá jako kočka.“

1. Generativní vs. Diskriminační modely

Pochopení rozdílu mezi těmito dvěma přístupy je klíčové pro studium strojového učení.

Typ modelu	Cíl	Matematický princip
Diskriminační	Klasifikace a predikce štítků.	Učí se hranici mezi třídami $P(y\|x)$.
Generativní	Tvorba nových datových bodů.	Učí se distribuci samotných dat $P(x)$ nebo $P(x,y)$.

2. Klíčové architektury generativních modelů

V moderní AI dominuje několik architektur, z nichž každá má jiný přístup k tvorbě dat:

A. Generative Adversarial Networks ([[it_encyklopedie:gan|GAN]])

Dvě sítě soupeřící proti sobě. Generátor tvoří data a diskriminátor se je snaží odhalit jako podvrh.

Vhodné pro: Vysoce realistické fotografie a textury.

B. Variational Autoencoders (VAE)

Rozšíření klasických autoencoderů, které kóduje data do pravděpodobnostního prostoru.

Vhodné for: Hladké přechody mezi obrazy (morphing), syntéza hlasu.

C. Difuzní modely (Diffusion Models)

Aktuální špička v generování obrazu. Model se učí postupně odstraňovat šum z náhodných pixelů, dokud nevznikne čistý obraz.

Příklad: Midjourney, Stable Diffusion, DALL-E.

D. Autoregresivní modely ([[it_encyklopedie:llm|LLM]])

Modely, které předpovídají další prvek v sekvenci (např. další slovo) na základě všech předchozích.

Příklad: GPT-4, Llama.

3. Proces vzorkování (Sampling)

Generativní modely nefungují jako vyhledávače. Nevybírají z databáze existující obrázky, ale „vzorkují“ z naučeného latentního prostoru. Tento prostor je vícerozměrná mapa všech možných variant dat, která model zná. Posunem v tomto prostoru (např. změnou vektoru „věk“ nebo „styl“) můžeme měnit vlastnosti výsledku.

4. Praktické využití

Media & Zábava: Tvorba digitálního umění, hudby, scénářů a herních prostředí.
Programování: Generování kódu (GitHub Copilot).
Personalizace: Tvorba syntetických hlasů a avatarů pro zákaznickou podporu.
Věda: Návrh nových molekul pro léky nebo simulace fyzikálních jevů.

5. Etické a technické výzvy

Halucinace: Model může generovat fakticky nesprávné, ale velmi přesvědčivě vypadající informace.
Autorská práva: Otázka, komu patří práva na obsah vygenerovaný na základě děl lidských autorů.
Deepfakes: Snadná tvorba falešných důkazů a dezinformací.

Zajímavost: Generativní modely jsou tak pokročilé, že v některých testech lidé nedokážou rozlišit mezi obrazem vytvořeným člověkem a AI v 70 % případů.

Zpět na AI rozcestník