====== GAN (Generative Adversarial Networks) ====== **GAN** je třída algoritmů strojového učení, ve které proti sobě stojí dvě neuronové sítě v rámci hry s nulovým součtem. Tento "souboj" umožňuje systému generovat nová, syntetická data (obrázky, hudbu, text), která jsou nerozeznatelná od skutečných předloh. ===== 1. Architektura: Souboj dvou sítí ===== Princip GAN lze přirovnat k souboji mezi **padělatelem** a **detektivem**: * **Generátor (Generator):** Síť, která se snaží vytvořit falešná data (např. obrázek obličeje). Na začátku produkuje pouze náhodný šum, ale postupem času se zlepšuje v napodobování trénovacích dat. * **Diskriminátor (Discriminator):** Síť, která dostává na vstup jak reálná data z trénovací sady, tak falešná data od generátoru. Jejím úkolem je rozpoznat, co je pravé a co je podvrh. ===== 2. Proces trénování (Adversarial Training) ===== Učení probíhá v neustálém cyklu zpětné vazby: 1. Generátor vytvoří vzorek. 2. Diskriminátor jej ohodnotí (např. "90% pravděpodobnost, že jde o podvrh"). 3. **Zpětná vazba:** Generátor využije tuto informaci, aby příště vytvořil lepší podvrh. Zároveň se Diskriminátor učí z chyb, které udělal, aby byl příště přísnější. 4. Cílem je dosáhnout stavu (tzv. **Nashova rovnováha**), kdy generátor vytváří tak dokonalá data, že diskriminátor má pouze 50% šanci na úspěch (čistý tip). [Image visualization of GAN training process showing loss curves for generator and discriminator] ===== 3. Typy a varianty GAN ===== ^ Typ ^ Popis ^ Využití ^ | **DCGAN** | Využívá konvoluční sítě ([[it_encyklopedie:cnn|CNN]]). | Generování realistických fotografií. | | **CycleGAN** | Dokáže přenést styl z jednoho obrazu na jiný bez párových dat. | Změna dne na noc, přeměna koně na zebru. | | **StyleGAN** | Umožňuje jemné ovládání rysů (např. věk, výraz, barva vlasů). | Tvorba hyperrealistických lidských tváří. | | **SRGAN** | Super-Resolution GAN. | Zvyšování rozlišení a kvality starých nebo nekvalitních fotek. | ===== 4. Praktické aplikace ===== * **Deepfakes:** Vytváření realistických videí a hlasových nahrávek osob. * **Design a umění:** Navrhování nových modelů oblečení, nábytku nebo generování textur pro videohry. * **Medicína:** Generování syntetických rentgenových snímků pro trénování jiných AI modelů tam, kde je málo reálných dat. * **Astronomie:** Rekonstrukce detailů vesmírných těles z neostrých snímků. ===== 5. Rizika a výzvy ===== * **Etika:** Zneužití pro tvorbu dezinformací a falešných důkazů. * **Stabilita trénování:** GAN jsou známé tím, že se obtížně trénují. Může dojít k tzv. **Mode Collapse**, kdy generátor najde jeden typ obrázku, který diskriminátor "baští", a přestane generovat cokoli jiného. * **Výpočetní náročnost:** Vyžadují výkonné grafické karty (GPU) a velké množství času. > **Zajímavost:** Webová stránka **"thispersondoesnotexist.com"** využívá StyleGAN od společnosti NVIDIA k tomu, aby při každém obnovení stránky vygenerovala portrét člověka, který ve skutečnosti nikdy neexistoval. [[it_encyklopedie:ai_rozcestnik|Zpět na AI rozcestník]]