Generativní model je typ statistického modelu, který se používá k popisu toho, jak byla data vygenerována. Jeho hlavním úkolem je naučit se vnitřní rozdělení pravděpodobnosti trénovací sady natolik dobře, aby byl schopen vytvářet nové vzorky, které mají stejné vlastnosti jako původní data.
Pokud diskriminační model odpovídá na otázku: „Patří tento obrázek do kategorie kočka?“, generativní model odpovídá na otázku: „Vygeneruj mi nový obrázek, který vypadá jako kočka.“
Pochopení rozdílu mezi těmito dvěma přístupy je klíčové pro studium strojového učení.
| Typ modelu | Cíl | Matematický princip | |
|---|---|---|---|
| Diskriminační | Klasifikace a predikce štítků. | Učí se hranici mezi třídami $P(y | x)$. |
| Generativní | Tvorba nových datových bodů. | Učí se distribuci samotných dat $P(x)$ nebo $P(x,y)$. |
V moderní AI dominuje několik architektur, z nichž každá má jiný přístup k tvorbě dat:
Dvě sítě soupeřící proti sobě. Generátor tvoří data a diskriminátor se je snaží odhalit jako podvrh.
Rozšíření klasických autoencoderů, které kóduje data do pravděpodobnostního prostoru.
Aktuální špička v generování obrazu. Model se učí postupně odstraňovat šum z náhodných pixelů, dokud nevznikne čistý obraz.
Modely, které předpovídají další prvek v sekvenci (např. další slovo) na základě všech předchozích.
Generativní modely nefungují jako vyhledávače. Nevybírají z databáze existující obrázky, ale „vzorkují“ z naučeného latentního prostoru. Tento prostor je vícerozměrná mapa všech možných variant dat, která model zná. Posunem v tomto prostoru (např. změnou vektoru „věk“ nebo „styl“) můžeme měnit vlastnosti výsledku.
Zajímavost: Generativní modely jsou tak pokročilé, že v některých testech lidé nedokážou rozlišit mezi obrazem vytvořeným člověkem a AI v 70 % případů.