Obsah
Hluboké učení (Deep Learning)
Hluboké učení (Deep Learning) je specifická oblast strojového učení, která využívá algoritmy inspirované strukturou a funkcí lidského mozku, nazývané umělé neuronové sítě. Přívlastek „hluboké“ označuje použití velkého množství vrstev mezi vstupem a výstupem.
Zatímco klasické strojové učení vyžaduje, aby člověk ručně definoval důležité znaky (features), hluboké učení se tyto znaky učí extrahovat samo přímo z dat.
Architektura neuronové sítě
Hluboké učení zpracovává data skrze hierarchickou strukturu vrstev:
- Vstupní vrstva (Input Layer): Přijímá syrová data (např. pixely obrázku).
- Skryté vrstvy (Hidden Layers): Zde probíhá samotný výpočet. Každá vrstva hledá složitější vzorce – první vrstva hledá hrany, druhá tvary a desátá celé objekty.
- Výstupní vrstva (Output Layer): Poskytuje konečnou predikci (např. „Toto je kočka“).
Klíčové typy architektur
V IT praxi se setkáváme se třemi hlavními typy sítí:
| Typ sítě | Hlavní využití |
|---|---|
| CNN (Konvoluční) | Analýza obrazu, rozpoznávání tváří, medicínské skenování. |
| RNN / LSTM | Zpracování textu, řeči a časových řad (predikce burzy). |
| Transformers | Základ pro moderní LLM (ChatGPT, Gemini). Excelují v chápání kontextu. |
Hardware pro hluboké učení
Hluboké učení je extrémně náročné na výpočetní výkon. Vyžaduje miliony matematických operací s maticemi současně, což nezvládají běžné CPU, ale specializované čipy:
- GPU (Graphics Processing Unit): Původně pro hry, dnes standard pro trénování AI díky tisícům malých jader.
- NPU (Neural Processing Unit): Součást moderních SoC (Apple Neural Engine), optimalizovaná pro běh hotových modelů s nízkou spotřebou.
- TPU (Tensor Processing Unit): Specializované čipy od Google pro obří datová centra, na jejichž návrhu spolupracuje Broadcom.
Výzvy a omezení
- Černá skříňka (Black Box): Často nevíme, proč síť dospěla k danému výsledku (problém interpretovatelnosti).
- Náročnost na data: Hluboké učení vyžaduje tisíce až miliony příkladů, aby bylo přesné.
- Energetická náročnost: Trénování velkých modelů spotřebovává obrovské množství elektřiny.
— Související pojmy: SoC, Broadcom, TSMC, Strojové učení
