====== Neuronové sítě: Architektura umělého mozku ====== **Neuronová síť** je matematický model složený z velkého množství vzájemně propojených výpočetních jednotek – **neuronů**. Síť se neučí pomocí explicitních instrukcí, ale úpravou síly spojení (vah) mezi těmito neurony na základě předložených příkladů. ===== 1. Struktura neuronové sítě ===== Standardní (dopředná) neuronová síť je organizována do vrstev: * **Vstupní vrstva (Input Layer):** Přijímá data (např. pixely obrázku nebo hodnoty v tabulce). * **Skryté vrstvy (Hidden Layers):** Zde probíhá samotné "přemýšlení". Síť extrahuje rysy a vzorce. Čím více je těchto vrstev, tím je síť "hlubší" (Deep Learning). * **Výstupní vrstva (Output Layer):** Poskytuje konečný výsledek (např. pravděpodobnost, že na obrázku je kočka). --- ===== 2. Jak funguje jeden neuron? ===== Umělý neuron je v podstatě matematická funkce, která provádí tři kroky: 1. **Vážený součet:** Každý vstup do neuronu má svou **váhu (weight)**, která určuje jeho důležitost. Tyto vstupy se sečtou. 2. **Bias (Zkreslení):** K součtu se přidá konstanta, která neuronu umožňuje lépe se přizpůsobit datům. 3. **Aktivační funkce:** Výsledek projde funkcí (např. ReLU nebo Sigmoid), která rozhodne, zda a jak silně bude neuron "pálit" (aktivovat se) dále do sítě. --- ===== 3. Proces učení (Backpropagation) ===== Učení neuronové sítě je iterační proces, který probíhá ve dvou fázích: ==== Dopředný chod (Forward Pass) ==== Data projdou sítí od vstupu k výstupu a síť vygeneruje předpověď. Na začátku je tato předpověď náhodná a chybná. ==== Zpětné šíření chyby (Backpropagation) ==== 1. **Loss Function (Ztrátová funkce):** Vypočítá se rozdíl (chyba) mezi předpovědí sítě a skutečným správným výsledkem. 2. **Optimizer:** Algoritmus (např. Gradient Descent) projde síť pozpátku a mírně upraví váhy u všech neuronů tak, aby byla chyba příště menší. Tento proces se opakuje milionykrát (na tzv. epochy), dokud síť nedosahuje vysoké přesnosti. --- ===== 4. Typy neuronových sítí ===== Podle toho, jak jsou neurony propojeny, rozlišujeme různé typy sítí pro různé úlohy: * **CNN (Konvoluční sítě):** Specializované na **obraz**. Dokážou rozpoznat hrany, tvary a objekty. * **RNN (Rekurentní sítě):** Mají "paměť", jsou vhodné pro **sekvenční data** (časové řady, překlad textu). * **Transformery:** Moderní architektura (základ ChatGPT), která dokáže zpracovávat obrovské množství dat paralelně a chápat kontext mezi vzdálenými slovy v textu. --- ===== 5. Hardware pro neuronové sítě ===== Trénování sítí vyžaduje obrovské množství matematických operací (násobení matic). Proto se místo klasických procesorů (CPU) používají: * **GPU (Grafické karty):** Navrženy pro masivní paralelní výpočty. * **TPU (Tensor Processing Units):** Čipy navržené Googlem speciálně pro zrychlení výpočtů neuronových sítí. ---- //Související články:// * [[it:sw:strojove_uceni|Strojové učení: Širší kontext]] * [[it:sw:ai|Umělá inteligence: Filozofie a historie]] * [[it:sw:python|Python: Knihovny TensorFlow a PyTorch]] //Tagy: {{tag>it ai neural-networks deep-learning math data-science}}//