Testovací data představují nezávislou část datasetu, která slouží k finálnímu vyhodnocení kvality natrénovaného modelu. Jejich nejdůležitější vlastností je, že jsou pro model „neviditelná“ – algoritmus k nim nesmí mít přístup během procesu učení ani během ladění parametrů.
Účelem testovacích dat je simulovat reálné nasazení (produkci), kdy model dostává zcela nové vstupy od uživatelů.
V rámci procesu rozdělení dat (Data Splitting) tvoří testovací data poslední instanci:
K úniku dat (Data Leakage) dochází, pokud se informace z testovací sady neúmyslně dostanou do trénovacího procesu. To vede k falešnému optimismu – model vypadá jako geniální (má 99% úspěšnost), ale v realitě selhává, protože si jen „pamatuje“ testovací otázky.
Jak zabránit kontaminaci:
Na základě výsledků z testovacích dat vypočítáváme metriky, které nám řeknou, jak je model dobrý:
| Metrika | Význam | Příklad |
|---|---|---|
| Accuracy (Přesnost) | Procento správně určených případů. | „Model trefil 95 % obrázků.“ |
| Precision | Schopnost neoznačit chybně negativní případ jako pozitivní. | „Kolik z označených spamů byl skutečně spam?“ |
| Recall (Úplnost) | Schopnost najít všechny pozitivní případy. | „Našel model všechny nádory na snímcích?“ |
| F1 Score | Harmonický průměr mezi Precision a Recall. | Ideální pro nevyvážená data. |
Hlavním cílem použití testovacích dat je ověřit schopnost zobecnění.
Příklad z praxe: Představte si testovací data jako závěrečnou zkoušku ve škole. Trénovací data jsou učebnice. Pokud učitel dá do zkoušky přesně stejné příklady, které jsou v učebnici, nezjistí, zda žák látku pochopil, nebo se ji jen naučil nazpaměť. Proto musí být ve zkoušce (testovacích datech) příklady nové, ale ze stejné látky.