====== Gemini (Google AI) ====== **Gemini** je rodina multimodálních velkých jazykových modelů (LLM) vyvinutých společností **Google DeepMind**. Představuje nejvýkonnější systém umělé inteligence od Googlu, který byl od počátku navržen jako „nativně multimodální“ – tedy schopný plynule pracovat s textem, kódem, zvukem, obrázky i videem. ===== Historie a vývoj ===== Cesta ke Gemini nebyla přímá a zahrnovala spojení dvou dříve konkurenčních laboratoří: **Google Brain** a **DeepMind**. * **Éra před Gemini (LaMDA a PaLM):** Google dlouho dominoval výzkumu AI (vynalezl architekturu [[chatgpt|Transformer]]), ale s vydáním produktů pro veřejnost váhal. Prvními modely byly LaMDA (konverzační) a PaLM (všestranný). * **Projekt Bard (únor 2023):** Jako narychlo připravená reakce na [[chatgpt|ChatGPT]] byl spuštěn chatbot Bard. Původně běžel na modelu LaMDA, později na PaLM 2. * **Zrození Gemini (prosinec 2023):** Google oficiálně představil značku Gemini jako svůj doposud nejvyspělejší model. V únoru 2024 byl pod tento název sjednocen i samotný chatbot (přejmenování Barda na Gemini). ===== Úrovně modelů Gemini ===== Google zvolil strategii „jedno jméno, různé velikosti“, aby pokryl vše od mobilních telefonů po obří datová centra: ^ Verze ^ Cílové zařízení ^ Charakteristika ^ | **Gemini Nano** | Lokální zařízení (např. Pixel 8/9). | Běží přímo na [[soc|SoC]] telefonu bez internetu. | | **Gemini Flash** | Rychlé API a webové aplikace. | Optimalizován pro rychlost a nízké náklady. | | **Gemini Pro** | Široká veřejnost a firemní zákazníci. | Vyvážený poměr výkonu a schopností. | | **Gemini Ultra** | Nejsložitější výpočetní úlohy. | Nejvýkonnější model pro vědecký výzkum a kódování. | ===== Klíčové inovace: Kontextové okno ===== Jednou z největších předností Gemini je **extrémně dlouhé kontextové okno**. Zatímco běžné modely si „pamatují“ desítky stran textu, Gemini 1.5 Pro dokáže najednou zpracovat: * Přes 1 milion tokenů (ekvivalent tisíců stránek textu). * Hodinu videa nebo 11 hodin zvukového záznamu. * Desítky tisíc řádků zdrojového kódu. ===== Současnost a integrace (2025–2026) ===== V současnosti je Gemini integrováno do celého ekosystému Google: * **Google Workspace:** Pomoc při psaní v Dokumentech a analýza dat v Tabulkách. * **Android:** Gemini nahrazuje klasického Google Assistenta jako inteligentní vrstva operačního systému. * **Vertex AI:** Platforma pro vývojáře, kde si firmy trénují vlastní modely na infrastruktuře Googlu. * **Hardware:** Úzká optimalizace pro čipy Google Tensor a AI akcelerátory TPU v datových centrech. --- //Související pojmy: [[chatgpt|ChatGPT]], [[openai|OpenAI]], [[hluboke_uceni|Hluboké učení]], [[soc|SoC]]//