Uživatelské nástroje

Nástroje pro tento web


mlp

MLP (Multi-Layer Perceptron)

MLP je typ dopředné (feedforward) umělé neuronové sítě. „Dopředná“ znamená, že data proudí pouze jedním směrem – od vstupu k výstupu – bez smyček (na rozdíl od RNN). MLP je považován za „univerzálního aproximátora“, což znamená, že s dostatečným počtem neuronů dokáže napodobit téměř jakoukoli matematickou funkci.

1. Struktura MLP

MLP se skládá minimálně ze tří vrstev uzlů (neuronů):

  • Vstupní vrstva (Input Layer): Přijímá surové příznaky z datasetu.
  • Skrytá vrstva (Hidden Layer): Jedna nebo více vrstev mezi vstupem a výstupem. Zde probíhá extrakce složitých vzorců.
  • Výstupní vrstva (Output Layer): Produkuje finální predikci (např. třídu nebo číselnou hodnotu).

2. Klíčové inovace oproti perceptronu

Proč je MLP mnohem silnější než základní perceptron?

  • Skryté vrstvy: Umožňují síti vytvářet vnitřní reprezentace dat. Čím více vrstev, tím komplexnější vztahy dokáže síť zachytit.
  • Nelineární aktivační funkce: Zatímco původní perceptron používal jen „skokovou“ funkci, MLP používá funkce jako ReLU, Sigmoid nebo Tanh. To mu umožňuje řešit problémy, které nejsou lineárně oddělitelné (např. slavný problém XOR).
  • Algoritmus Backpropagation: Mechanismus, který umožňuje efektivně trénovat více vrstev najednou tím, že chybu z výstupu „distribuuje“ zpět ke všem váhám v síti.

3. Jak probíhá výpočet?

Každé spojení mezi neurony má svou váhu. Proces probíhá následovně:

1. Neuron ve skryté vrstvě sečte všechny vážené vstupy a přičte **bias**.
2. Výsledek projde aktivační funkcí (např. $f(x) = \max(0, x)$ pro ReLU).
3. Tento výstup se stává vstupem pro neurony v další vrstvě.

4. Použití v praxi

Ačkoliv jsou dnes pro obraz populární CNN a pro text Transformery, MLP zůstává základem pro:

  • Tabulková data: Předpovídání cen nemovitostí, bankovní skóring, klasifikace zákazníků.
  • Závěrečné vrstvy: Většina moderních architektur (včetně CNN) končí jednou nebo více vrstvami MLP pro finální rozhodnutí.
  • Komprese dat: V rámci autoencoderů.

Srovnání: Perceptron vs. MLP

Vlastnost Perceptron MLP
Vrstvy Pouze vstupní a výstupní Vstupní, skryté a výstupní
Rozhodovací hranice Vždy jen přímka (lineární) Libovolně složitá křivka
Problém XOR Nedokáže vyřešit Hravě vyřeší
Aktivační funkce Step function (0 nebo 1) Spojité nelineární funkce
Zajímavost: Teoreticky stačí MLP pouze jedna skrytá vrstva s dostatečným počtem neuronů k tomu, aby se naučil jakoukoli spojitou funkci. V praxi je však efektivnější mít více vrstev s méně neurony (tzv. „hluboké“ sítě).

Zpět na AI rozcestník

mlp.txt · Poslední úprava: autor: admin