====== Strojové učení (Machine Learning) ====== **Strojové učení** je proces, při kterém počítačový systém analyzuje data, identifikuje v nich vzorce a na jejich základě vytváří předpovědi nebo rozhodnutí. Je to motor, který pohání vše od doporučování filmů na Netflixu až po autonomní vozidla. ===== 1. Tři základní typy učení ===== Algoritmy strojového učení se dělí podle toho, jakým způsobem získávají znalosti: ==== Učení s učitelem (Supervised Learning) ==== Model trénujeme na datech, která už mají „správné odpovědi“ (labely). * **Příklad:** Ukážeme modelu tisíce fotek psů a koček, přičemž každá je označená. Model se naučí rozpoznat znaky typické pro každé zvíře. * **Využití:** Předpověď cen nemovitostí, detekce spamu. ==== Učení bez učitele (Unsupervised Learning) ==== Model dostane data bez popisků a musí v nich sám najít skryté struktury nebo podobnosti. * **Příklad:** Rozdělení zákazníků e-shopu do skupin (shlukování) podle jejich nákupního chování. * **Využití:** Segmentace trhu, detekce anomálií (např. podvody s kreditkami). ==== Posilované učení (Reinforcement Learning) ==== Model (agent) se učí metodou pokus-omyl v určitém prostředí. Za správné kroky dostává „odměnu“, za špatné „trest“. * **Příklad:** AI učící se hrát šachy nebo ovládat robotické rameno. * **Využití:** Robotika, hry, optimalizace logistiky. --- ===== 2. Proces vývoje ML modelu ===== Tvorba modelu není jen o programování, ale o celém životním cyklu: * **Sběr a příprava dat:** Nejdůležitější krok. „Špatná data dovnitř = špatná data ven“ (GIGO - Garbage In, Garbage Out). * **Výběr algoritmu:** Volba vhodného matematického modelu (např. rozhodovací stromy, neuronové sítě). * **Trénování:** Proces, kdy model prochází data a nastavuje své vnitřní parametry. * **Evaluace (Vyhodnocení):** Testování modelu na datech, která během tréninku neviděl, aby se ověřila jeho přesnost. --- ===== 3. Neuronové sítě a Deep Learning ===== **Hluboké učení** (Deep Learning) je specifická oblast ML inspirovaná strukturou lidského mozku. Používá vícevrstvé **neuronové sítě**, které jsou schopny zpracovávat extrémně komplexní data (obraz, zvuk, přirozený jazyk). * **Vstupní vrstva:** Přijímá surová data (např. pixely obrázku). * **Skryté vrstvy:** Provádějí matematické transformace a extrahují znaky (hrany, tvary, objekty). * **Výstupní vrstva:** Podá konečný výsledek (např. „Je to auto“). --- ===== 4. Časté problémy ===== * **Overfitting (Přeučení):** Model se naučil trénovací data „nazpaměť“ včetně šumu, ale selhává na nových datech. * **Underfitting (Nedoučení):** Model je příliš jednoduchý a nedokáže v datech najít žádný vzorec. * **Zaujatost dat (Data Bias):** Pokud trénovací data obsahují předsudky, model je převezme (např. diskriminace v náborových systémech). ---- //Související články:// * [[it:sw:ai_basics|Základy AI a Llama]] * [[it:sw:python|Python: Jazyk pro AI]] * [[it:sw:big_data|Big Data a jejich zpracování]] //Tagy: {{tag>ai machine-learning deep-learning data-science neural-networks}}//