Obsah
Implicitní neuronové reprezentace (INR)
Implicitní neuronové reprezentace (INR) představují paradigma, kde je signál (obraz, zvuk, 3D tvar nebo video) reprezentován jako spojitá funkce aproximovaná neuronovou sítí.
Na rozdíl od explicitních reprezentací (kde jsou data uložena v diskrétních strukturách jako jsou pixely nebo polygony), INR ukládá informaci do samotných vah ($\theta$) neuronové sítě.
Explicitní vs. Implicitní reprezentace
| Typ | Datová struktura | Příklad |
|---|---|---|
| Explicitní | Mřížka (Grid), Tabulka, Mesh. | JPEG (pixely), STL (trojúhelníky), MP3 (vzorky). |
| Implicitní | Parametry neuronové sítě (Váhy). | NeRF, SIREN, Occupancy Networks. |
Matematický princip
V INR definujeme funkci $f_\theta$, která mapuje souřadnice na hodnotu signálu: $$y = f_\theta(x)$$ * $x$: Vstupní souřadnice (např. čas $t$, prostor $x,y,z$ nebo úhel pohledu). * $y$: Hodnota v daném bodě (např. barva, hustota, akustický tlak). * $\theta$: Parametry sítě, které „kódují“ vzhled nebo tvar objektu.
Proč je to "Implicitní"?
Nazývá se tak proto, že povrch objektu nebo detaily obrazu nejsou nikde přímo „zapsány“. Jsou definovány implicitně – například jako množina všech bodů, kde funkce vrací určitou hodnotu (např. povrch 3D objektu je tam, kde $f(x,y,z) = 0$).
Klíčové výhody
- Nezávislost na rozlišení: Protože je funkce spojitá, můžeme se na detail dotázat v libovolném měřítku (nekonečný zoom).
- Diferencovatelnost: Celá reprezentace je matematicky hladká. To umožňuje používat derivace pro optimalizaci tvarů nebo řešení fyzikálních úloh (vazba na Neural ODEs).
- Komprese: Komplexní 3D scény, které by vyžadovaly gigabajty dat v mřížce voxelů, lze uložit do několika megabajtů parametrů sítě.
Aktivační funkce: Klíč k detailu
Klasické sítě používají funkci ReLU, která je však pro INR nevhodná, protože „vyhlazuje“ detaily. Moderní INR využívají:
- SIREN: Sinusoidální aktivace umožňující zachytit jemné textury a hrany.
- Fourier Features: Mapování vstupů do vysokofrekvenčního prostoru, aby síť „viděla“ ostře.
Využití v moderním IT (2025+)
- Neurální rendering: Generování realistického 3D prostředí v reálném čase (pokračovatel klasického ray-tracingu).
- Analýza signálů: Čištění šumu ze starých nahrávek nebo fotografií pomocí neurální rekonstrukce.
- Vědecké simulace: Modelování proudění kapalin nebo šíření tepla jako spojitých neurálních polí.
— Související pojmy: Coordinate Networks, Neural ODEs, Hluboké učení
