Bias v IT a umělé inteligenci označuje situaci, kdy algoritmus produkuje systematicky zkreslené výsledky kvůli chybným předpokladům v procesu učení, návrhu nebo kvůli nekvalitním datům. V oblasti AI může bias vést k diskriminaci skupin lidí nebo k chybným predikcím.
Nejčastější forma. Pokud jsou trénovací data historicky nespravedlivá nebo nereprezentativní, model se tyto předsudky naučí.
Vzniká, když data použitá k trénování neodpovídají realitě cílové populace.
Vzniká chybou v samotném kódu nebo v nastavení priorit algoritmu (např. přílišná optimalizace na jeden parametr na úkor ostatních).
Ve strojovém učení existuje základní dilema mezi dvěma typy chyb:
| Pojem | Popis | Důsledek |
|---|---|---|
| High Bias | Model je příliš jednoduchý (Underfitting). | Ignoruje důležité vztahy v datech a dává konzistentně špatné výsledky. |
| High Variance | Model je příliš komplexní (Overfitting). | Příliš se soustředí na náhodný šum v trénovacích datech a selhává u nových dat. |
Bias v AI má etické i právní důsledky:
Boj proti předpojatosti je nekončící proces, který zahrnuje:
Důležité upozornění: Úplné odstranění biasu je prakticky nemožné, protože i samotná data jsou produktem lidské společnosti, která je přirozeně subjektivní. Cílem je tedy bias identifikovat, minimalizovat a transparentně o něm informovat.