====== Strojové učení v širším kontextu ======

**Strojové učení (ML)** představuje změnu paradigmatu v softwarovém inženýrství. Je to most mezi statistikou, informatikou a kognitivní vědou. V širším slova smyslu jde o automatizaci samotného procesu tvorby algoritmů.

===== 1. Změna paradigmatu (Software 2.0) =====

Andrej Karpathy (přední vědec v oboru AI) označuje strojové učení jako **Software 2.0**.

  * **Software 1.0 (Tradiční):** Kód píší lidé (např. v C++, Pythonu). Je čitelný, ale složitý na údržbu u komplexních úloh, jako je rozpoznávání obrazu.
  * **Software 2.0 (ML):** Lidé definují cíl a architekturu (např. [[it:sw:neural_networks|neuronovou síť]]), ale samotné parametry "píše" proces optimalizace na základě dat. Výsledný "kód" (váhy sítě) je pro člověka nečitelný, ale v dané úloze mnohem výkonnější.


---

===== 2. Datová věda jako základ (Data Science) =====

ML nemůže existovat bez kvalitních dat. Širší kontext zahrnuje celý proces **Data Science**:
  1. **Sběr dat (Ingestion):** Získávání surovin z logů, senzorů nebo uživatelských vstupů.
  2. **Čištění (Cleaning):** Odstranění šumu a chyb (nejvíce časově náročná část).
  3. **Feature Engineering:** Výběr nejdůležitějších vlastností dat, které mají na výsledek vliv.
  4. **Trénování a Evaluace:** Samotné strojové učení.


---

===== 3. Socio-ekonomický dopad =====

Strojové učení mění ekonomiku mnoha odvětví:
  * **Personalizace jako standard:** ML umožnilo vznik "ekonomiky pozornosti" (Netflix, TikTok), kde algoritmus zná uživatele lépe než on sám.
  * **Demokratizace expertízy:** ML modely umožňují provádět lékařskou diagnostiku nebo právní analýzu v místech, kde chybí lidští experti.
  * **Prediktivní údržba:** V průmyslu ML předpovídá poruchy strojů dříve, než nastanou, což šetří miliardy korun.

---

===== 4. Limity a rizika (Teoretický rámec) =====

  * **Problém "Černé skříňky" (Explainability):** U hlubokých sítí víme, ŽE fungují, ale často přesně nevíme, PROČ se rozhodly konkrétním způsobem. To je problém v lékařství nebo soudnictví.
  * **Přetrénování (Overfitting):** Situace, kdy se model "naučí trénovací data nazpaměť" včetně jejich chyb, ale nedokáže zobecnit své znalosti na nové situace.
  * **Kvalita dat (GIGO - Garbage In, Garbage Out):** Pokud model trénujeme na zaujatých nebo nekvalitních datech, výsledky budou stejně špatné nebo diskriminační.


---

===== 5. Budoucnost: Směrem k AGI? =====

V širším kontextu je dnešní ML považováno za tzv. **Narrow AI** (úzkou AI). Současný výzkum směřuje k:
  * **Transfer Learning:** Schopnost modelu využít znalosti z jedné úlohy pro jinou.
  * **Few-shot Learning:** Schopnost učit se z minimálního množství příkladů (podobně jako lidé).
  * **Multimodalita:** Modely, které současně chápou text, obraz, zvuk i fyzikální zákony.

----
//Související články://
  * [[it:sw:strojove_uceni|Strojové učení: Technické základy]]
  * [[it:sw:ai|Umělá inteligence: Historie a filozofie]]
  * [[it:sw:neural_networks|Neuronové sítě: Motor dnešního ML]]

//Tagy: {{tag>it ml data-science software-engineering ai futurology}}//