====== MLOps (Machine Learning Operations) ====== **MLOps** je soubor praktik, procesů a nástrojů zaměřených na efektivní nasazení, monitorování a správu modelů [[it_encyklopedie:machine_learning|strojového učení]] v produkčním prostředí. MLOps přebírá principy z metodiky **DevOps** (jako je CI/CD) a rozšiřuje je o specifika světa AI – tedy o správu dat a neustálé vyhodnocování kvality modelů. Zatímco DevOps se soustředí na kód, MLOps se soustředí na trojúhelník: **Kód + Data + Model**. ===== 1. Klíčové fáze MLOps cyklu ===== Životní cyklus modelu v MLOps není lineární, ale tvoří neustálou smyčku: * **Příprava dat:** Automatizace čištění, transformace a verzování datasetů (Data Engineering). * **Experimentování:** Vývoj modelu, ladění parametrů a sledování výsledků různých pokusů. * **CI/CD pro ML:** Automatické testování nejen kódu, ale i kvality modelu před jeho nasazením. * **Nasazení (Serving):** Zpřístupnění modelu přes [[it_encyklopedie:api|API]] nebo v rámci aplikace. * **Monitorování:** Sledování výkonu modelu v reálném čase a detekce chyb. * **Retraining:** Automatické spuštění nového trénování, pokud se přesnost modelu zhorší. ===== 2. Srovnání: DevOps vs. MLOps ===== ^ Vlastnost ^ DevOps ^ MLOps ^ | **Hlavní artefakt** | Kód a binární soubory. | Kód, data a artefakty modelů. | | **Předvídatelnost** | Vysoká (kód se chová deterministicky). | Nízká (model se mění podle vstupních dat). | | **Verzování** | Verzuje se pouze zdrojový kód (Git). | Musí se verzovat kód i data (např. DVC). | | **Monitoring** | Sleduje se zdraví serveru a chyby. | Sleduje se navíc přesnost a "drift" dat. | ===== 3. Hlavní výzvy, které MLOps řeší ===== * **Model Drift (Zastarávání):** Svět se mění. Model na předpověď prodejů vycvičený před rokem 2020 by v roce 2021 kvůli pandemii naprosto selhal. MLOps tento úpadek detekuje. * **Reprodukovatelnost:** Zajištění, že pokud model natrénujete znovu za měsíc, dostanete stejné výsledky (díky verzování dat). * **Škálovatelnost:** Přechod od jednoho modelu v notebooku datového vědce k tisícům požadavků za sekundu od uživatelů. ===== 4. Nástroje MLOps (2025) ===== Ekosystém MLOps je dnes tvořen specializovanými nástroji: * **Experiment Tracking:** [[it_encyklopedie:mlflow|MLflow]], Weights & Biases (sledování parametrů a výsledků). * **Data Versioning:** DVC (Data Version Control), lakeFS. * **Orchestrace:** Apache Airflow, Kubeflow (automatizace celého workflow). * **Model Serving:** Seldon, BentoML (snadné vystavení modelu jako API). * **Cloudové platformy:** Google Vertex AI, AWS SageMaker, Azure ML (komplexní řešení "vše v jednom"). ===== 5. Úrovně zralosti MLOps ===== * **Úroveň 0 (Manuální):** Model se trénuje a nasazuje ručně. Žádná automatizace. * **Úroveň 1 (Automatizace trénování):** Potrubí pro trénování je automatizované (Continuous Training). * **Úroveň 2 (CI/CD automatizace):** Plně automatizovaný systém, který sám testuje, nasazuje a monitoruje modely v produkci. > **Zajímavost:** Podle studií až 80 % modelů vyvinutých datovými vědci nikdy neskončí v produkci. MLOps je disciplína, která má toto číslo radikálně snížit a zajistit, aby investice do AI přinášely skutečnou hodnotu. [[it_encyklopedie:ai_rozcestnik|Zpět na AI rozcestník]]