MLP (Multi-Layer Perceptron)

MLP je typ dopředné (feedforward) umělé neuronové sítě. „Dopředná“ znamená, že data proudí pouze jedním směrem – od vstupu k výstupu – bez smyček (na rozdíl od RNN). MLP je považován za „univerzálního aproximátora“, což znamená, že s dostatečným počtem neuronů dokáže napodobit téměř jakoukoli matematickou funkci.

1. Struktura MLP

MLP se skládá minimálně ze tří vrstev uzlů (neuronů):

Vstupní vrstva (Input Layer): Přijímá surové příznaky z datasetu.
Skrytá vrstva (Hidden Layer): Jedna nebo více vrstev mezi vstupem a výstupem. Zde probíhá extrakce složitých vzorců.
Výstupní vrstva (Output Layer): Produkuje finální predikci (např. třídu nebo číselnou hodnotu).

2. Klíčové inovace oproti perceptronu

Proč je MLP mnohem silnější než základní perceptron?

Skryté vrstvy: Umožňují síti vytvářet vnitřní reprezentace dat. Čím více vrstev, tím komplexnější vztahy dokáže síť zachytit.
Nelineární aktivační funkce: Zatímco původní perceptron používal jen „skokovou“ funkci, MLP používá funkce jako ReLU, Sigmoid nebo Tanh. To mu umožňuje řešit problémy, které nejsou lineárně oddělitelné (např. slavný problém XOR).
Algoritmus Backpropagation: Mechanismus, který umožňuje efektivně trénovat více vrstev najednou tím, že chybu z výstupu „distribuuje“ zpět ke všem váhám v síti.

3. Jak probíhá výpočet?

Každé spojení mezi neurony má svou váhu. Proces probíhá následovně:

1. Neuron ve skryté vrstvě sečte všechny vážené vstupy a přičte **bias**.
2. Výsledek projde aktivační funkcí (např. $f(x) = \max(0, x)$ pro ReLU).
3. Tento výstup se stává vstupem pro neurony v další vrstvě.

4. Použití v praxi

Ačkoliv jsou dnes pro obraz populární CNN a pro text Transformery, MLP zůstává základem pro:

Tabulková data: Předpovídání cen nemovitostí, bankovní skóring, klasifikace zákazníků.
Závěrečné vrstvy: Většina moderních architektur (včetně CNN) končí jednou nebo více vrstvami MLP pro finální rozhodnutí.
Komprese dat: V rámci autoencoderů.

Srovnání: Perceptron vs. MLP

Vlastnost	Perceptron	MLP
Vrstvy	Pouze vstupní a výstupní	Vstupní, skryté a výstupní
Rozhodovací hranice	Vždy jen přímka (lineární)	Libovolně složitá křivka
Problém XOR	Nedokáže vyřešit	Hravě vyřeší
Aktivační funkce	Step function (0 nebo 1)	Spojité nelineární funkce

Zajímavost: Teoreticky stačí MLP pouze jedna skrytá vrstva s dostatečným počtem neuronů k tomu, aby se naučil jakoukoli spojitou funkci. V praxi je však efektivnější mít více vrstev s méně neurony (tzv. „hluboké“ sítě).

Zpět na AI rozcestník