Gemini (Google AI)

Gemini je rodina multimodálních velkých jazykových modelů (LLM) vyvinutých společností Google DeepMind. Představuje nejvýkonnější systém umělé inteligence od Googlu, který byl od počátku navržen jako „nativně multimodální“ – tedy schopný plynule pracovat s textem, kódem, zvukem, obrázky i videem.

Historie a vývoj

Cesta ke Gemini nebyla přímá a zahrnovala spojení dvou dříve konkurenčních laboratoří: Google Brain a DeepMind.

Éra před Gemini (LaMDA a PaLM): Google dlouho dominoval výzkumu AI (vynalezl architekturu Transformer), ale s vydáním produktů pro veřejnost váhal. Prvními modely byly LaMDA (konverzační) a PaLM (všestranný).
Projekt Bard (únor 2023): Jako narychlo připravená reakce na ChatGPT byl spuštěn chatbot Bard. Původně běžel na modelu LaMDA, později na PaLM 2.
Zrození Gemini (prosinec 2023): Google oficiálně představil značku Gemini jako svůj doposud nejvyspělejší model. V únoru 2024 byl pod tento název sjednocen i samotný chatbot (přejmenování Barda na Gemini).

Úrovně modelů Gemini

Google zvolil strategii „jedno jméno, různé velikosti“, aby pokryl vše od mobilních telefonů po obří datová centra:

Verze	Cílové zařízení	Charakteristika
Gemini Nano	Lokální zařízení (např. Pixel 8/9).	Běží přímo na SoC telefonu bez internetu.
Gemini Flash	Rychlé API a webové aplikace.	Optimalizován pro rychlost a nízké náklady.
Gemini Pro	Široká veřejnost a firemní zákazníci.	Vyvážený poměr výkonu a schopností.
Gemini Ultra	Nejsložitější výpočetní úlohy.	Nejvýkonnější model pro vědecký výzkum a kódování.

Klíčové inovace: Kontextové okno

Jednou z největších předností Gemini je extrémně dlouhé kontextové okno. Zatímco běžné modely si „pamatují“ desítky stran textu, Gemini 1.5 Pro dokáže najednou zpracovat:

Přes 1 milion tokenů (ekvivalent tisíců stránek textu).
Hodinu videa nebo 11 hodin zvukového záznamu.
Desítky tisíc řádků zdrojového kódu.

Současnost a integrace (2025–2026)

V současnosti je Gemini integrováno do celého ekosystému Google:

Google Workspace: Pomoc při psaní v Dokumentech a analýza dat v Tabulkách.
Android: Gemini nahrazuje klasického Google Assistenta jako inteligentní vrstva operačního systému.
Vertex AI: Platforma pro vývojáře, kde si firmy trénují vlastní modely na infrastruktuře Googlu.
Hardware: Úzká optimalizace pro čipy Google Tensor a AI akcelerátory TPU v datových centrech.

— Související pojmy: ChatGPT, OpenAI, Hluboké učení, SoC