Obsah

Deep Learning (Hluboké učení)

Deep Learning (DL) je podmnožina strojového učení, která je založena na používání umělých neuronových sítí s mnoha vrstvami (proto „hluboké“). Tato technologie se snaží napodobit způsob, jakým lidský mozek zpracovává informace a učí se z velkého množství dat.

Zatímco klasické strojové učení často vyžaduje lidský zásah pro extrakci příznaků (feature engineering), Deep Learning je schopen se tyto příznaky naučit automaticky přímo ze surových dat.

1. Architektura hlubokých sítí

Hluboká síť se skládá ze tří základních typů vrstev:

2. Klíčové rozdíly oproti strojovému učení

Vlastnost Strojové učení (Tradiční) Deep Learning
Závislost na datech Funguje dobře i s menším množstvím dat. Vyžaduje masivní datasety pro dosažení vysoké přesnosti.
Hardwarové nároky Lze spustit na běžném CPU. Vyžaduje vysoký výkon GPU (grafické karty) nebo TPU.
Extrakce příznaků Člověk musí definovat, co je důležité (např. tvary uší). Síť si důležité znaky najde sama v rámci tréninku.
Doba trénování Sekundy až hodiny. Dny až týdny (u velkých modelů).

3. Typy neuronových sítí v DL

Deep Learning využívá různé architektury podle typu řešeného problému:

4. Jak probíhá učení?

Proces učení v hlubokých sítích stojí na dvou matematických pilířích:

1. Forward Propagation: Data projdou sítí a na konci vypadne odhad.
2. Loss Function (Chybová funkce) Vypočítá se rozdíl mezi odhadem a skutečností (chyba).
3. Backpropagation (Zpětné šíření chyby): Chyba se šíří zpět sítí a pomocí algoritmu Gradient Descent se upravují váhy (propojení) mezi neurony tak, aby příště byla chyba menší.

[Image showing forward and backward propagation cycles in a neural network]

5. Aplikace v praxi

Důležité: Deep Learning je často kritizován jako „Black Box“ (černá skříňka). I když víme, jak síť natrénovat, je extrémně obtížné přesně vysvětlit, proč se u konkrétního případu rozhodla tak, jak se rozhodla.

Zpět na AI rozcestník