====== Správa NVIDIA ovladačů (Driver Management) ====== Správa ovladačů NVIDIA v roce 2026 vyžaduje koordinaci mezi verzí jádra operačního systému, architekturou GPU a požadavky výpočetních frameworků (CUDA/PyTorch). ===== 1. Životní cyklus a výběr verze ===== Při správě ovladačů v podnikovém prostředí rozlišujeme tři hlavní distribuční kanály: ==== Production Branch (LTS) ==== * **Charakteristika:** Zaměřeno na maximální stabilitu a certifikaci ISV. * **Využití:** Produkční servery, kritické pracovní stanice. * **Podpora:** Dlouhodobá údržba (až 2 roky). ==== New Feature Branch ==== * **Charakteristika:** Obsahuje nejnovější optimalizace pro nové GPU modely a AI instrukce. * **Využití:** Testovací prostředí, vývojáři využívající nejnovější CUDA Toolkit. ===== 2. Nástroje pro správu ===== ==== Windows: NVIDIA App ==== V roce 2026 nahrazuje starý Control Panel a GeForce Experience. * **Update management:** Umožňuje vynutit instalaci pouze "Studio" verze. * **Telemetry:** Možnost vypnutí sběru dat v korporátním prostředí. ==== Linux: Repository Management ==== Na serverech se vyhněte ruční instalaci přes ''.run'' soubory. Používejte balíčkovací systémy: # Přidání oficiálního NVIDIA repozitáře (Ubuntu example) sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt update # Instalace konkrétní verze pro servery (bez GUI) sudo apt install nvidia-headless-560-server ===== 3. Monitoring a dohled ===== Pro efektivní správu je nutné sledovat stav ovladačů v reálném čase. ==== NVIDIA-SMI ==== Základní nástroj příkazové řádky. * ''nvidia-smi -q'': Detailní výpis (Power limits, HW topology). * ''nvidia-smi -l 5'': Sledování zátěže v 5s intervalech. ==== NVML (NVIDIA Management Library) ==== Pokud spravujete více stanic, doporučuje se integrace NVML do monitorovacích nástrojů (Prometheus/Grafana) pomocí **NVIDIA GPU Exporteru**. ===== 4. Časté administrativní úkoly ===== ^ Úkol ^ Příkaz / Postup ^ | **Zjištění verze** | ''nvidia-smi --query-gpu=driver_version --format=csv'' | | **Nastavení Power Limit** | ''nvidia-smi -pl 250'' (omezení spotřeby ve Wattech) | | **Persistence Mode** | ''nvidia-smi -pm 1'' (zrychluje start AI aplikací na Linuxu) | | **Odinstalace (čistá)** | Použití nástroje DDU (Display Driver Uninstaller) v nouzovém režimu. | > **Důležité:** Při aktualizaci ovladačů na Linux serveru vždy zkontrolujte, zda nedošlo k aktualizaci jádra (kernel). Pokud ano, ujistěte se, že je nainstalován balíček ''dkms'', který automaticky překompiluje ovladač pro nové jádro. --- **Související dokumentace:** * [[it:ovladace_a_cuda|Architektura CUDA]] * [[it:nastaveni_gpu_v_dockeru|Kontejnerizace a GPU]] * [[it:reseni_potizi_s_grafikou|Troubleshooting Guide]] --- **Vlastník dokumentu:** @IT_Infrastructure_Team **Poslední revize:** 04. 01. 2026