Obsah
Gemini (Google AI)
Gemini je rodina multimodálních velkých jazykových modelů (LLM) vyvinutých společností Google DeepMind. Představuje nejvýkonnější systém umělé inteligence od Googlu, který byl od počátku navržen jako „nativně multimodální“ – tedy schopný plynule pracovat s textem, kódem, zvukem, obrázky i videem.
Historie a vývoj
Cesta ke Gemini nebyla přímá a zahrnovala spojení dvou dříve konkurenčních laboratoří: Google Brain a DeepMind.
- Éra před Gemini (LaMDA a PaLM): Google dlouho dominoval výzkumu AI (vynalezl architekturu Transformer), ale s vydáním produktů pro veřejnost váhal. Prvními modely byly LaMDA (konverzační) a PaLM (všestranný).
- Projekt Bard (únor 2023): Jako narychlo připravená reakce na ChatGPT byl spuštěn chatbot Bard. Původně běžel na modelu LaMDA, později na PaLM 2.
- Zrození Gemini (prosinec 2023): Google oficiálně představil značku Gemini jako svůj doposud nejvyspělejší model. V únoru 2024 byl pod tento název sjednocen i samotný chatbot (přejmenování Barda na Gemini).
Úrovně modelů Gemini
Google zvolil strategii „jedno jméno, různé velikosti“, aby pokryl vše od mobilních telefonů po obří datová centra:
| Verze | Cílové zařízení | Charakteristika |
|---|---|---|
| Gemini Nano | Lokální zařízení (např. Pixel 8/9). | Běží přímo na SoC telefonu bez internetu. |
| Gemini Flash | Rychlé API a webové aplikace. | Optimalizován pro rychlost a nízké náklady. |
| Gemini Pro | Široká veřejnost a firemní zákazníci. | Vyvážený poměr výkonu a schopností. |
| Gemini Ultra | Nejsložitější výpočetní úlohy. | Nejvýkonnější model pro vědecký výzkum a kódování. |
Klíčové inovace: Kontextové okno
Jednou z největších předností Gemini je extrémně dlouhé kontextové okno. Zatímco běžné modely si „pamatují“ desítky stran textu, Gemini 1.5 Pro dokáže najednou zpracovat:
- Přes 1 milion tokenů (ekvivalent tisíců stránek textu).
- Hodinu videa nebo 11 hodin zvukového záznamu.
- Desítky tisíc řádků zdrojového kódu.
Současnost a integrace (2025–2026)
V současnosti je Gemini integrováno do celého ekosystému Google:
- Google Workspace: Pomoc při psaní v Dokumentech a analýza dat v Tabulkách.
- Android: Gemini nahrazuje klasického Google Assistenta jako inteligentní vrstva operačního systému.
- Vertex AI: Platforma pro vývojáře, kde si firmy trénují vlastní modely na infrastruktuře Googlu.
- Hardware: Úzká optimalizace pro čipy Google Tensor a AI akcelerátory TPU v datových centrech.
— Související pojmy: ChatGPT, OpenAI, Hluboké učení, SoC
