GAN (Generative Adversarial Networks)

GAN je třída algoritmů strojového učení, ve které proti sobě stojí dvě neuronové sítě v rámci hry s nulovým součtem. Tento „souboj“ umožňuje systému generovat nová, syntetická data (obrázky, hudbu, text), která jsou nerozeznatelná od skutečných předloh.

1. Architektura: Souboj dvou sítí

Princip GAN lze přirovnat k souboji mezi padělatelem a detektivem:

Generátor (Generator): Síť, která se snaží vytvořit falešná data (např. obrázek obličeje). Na začátku produkuje pouze náhodný šum, ale postupem času se zlepšuje v napodobování trénovacích dat.
Diskriminátor (Discriminator): Síť, která dostává na vstup jak reálná data z trénovací sady, tak falešná data od generátoru. Jejím úkolem je rozpoznat, co je pravé a co je podvrh.

2. Proces trénování (Adversarial Training)

Učení probíhá v neustálém cyklu zpětné vazby:

1. Generátor vytvoří vzorek.
2. Diskriminátor jej ohodnotí (např. "90% pravděpodobnost, že jde o podvrh").
3. **Zpětná vazba:** Generátor využije tuto informaci, aby příště vytvořil lepší podvrh. Zároveň se Diskriminátor učí z chyb, které udělal, aby byl příště přísnější.
4. Cílem je dosáhnout stavu (tzv. **Nashova rovnováha**), kdy generátor vytváří tak dokonalá data, že diskriminátor má pouze 50% šanci na úspěch (čistý tip).

[Image visualization of GAN training process showing loss curves for generator and discriminator]

3. Typy a varianty GAN

Typ	Popis	Využití
DCGAN	Využívá konvoluční sítě (CNN).	Generování realistických fotografií.
CycleGAN	Dokáže přenést styl z jednoho obrazu na jiný bez párových dat.	Změna dne na noc, přeměna koně na zebru.
StyleGAN	Umožňuje jemné ovládání rysů (např. věk, výraz, barva vlasů).	Tvorba hyperrealistických lidských tváří.
SRGAN	Super-Resolution GAN.	Zvyšování rozlišení a kvality starých nebo nekvalitních fotek.

4. Praktické aplikace

Deepfakes: Vytváření realistických videí a hlasových nahrávek osob.
Design a umění: Navrhování nových modelů oblečení, nábytku nebo generování textur pro videohry.
Medicína: Generování syntetických rentgenových snímků pro trénování jiných AI modelů tam, kde je málo reálných dat.
Astronomie: Rekonstrukce detailů vesmírných těles z neostrých snímků.

5. Rizika a výzvy

Etika: Zneužití pro tvorbu dezinformací a falešných důkazů.
Stabilita trénování: GAN jsou známé tím, že se obtížně trénují. Může dojít k tzv. Mode Collapse, kdy generátor najde jeden typ obrázku, který diskriminátor „baští“, a přestane generovat cokoli jiného.
Výpočetní náročnost: Vyžadují výkonné grafické karty (GPU) a velké množství času.

Zajímavost: Webová stránka „thispersondoesnotexist.com“ využívá StyleGAN od společnosti NVIDIA k tomu, aby při každém obnovení stránky vygenerovala portrét člověka, který ve skutečnosti nikdy neexistoval.

Zpět na AI rozcestník