Obsah

Gemini (Google AI)

Gemini je rodina multimodálních velkých jazykových modelů (LLM) vyvinutých společností Google DeepMind. Představuje nejvýkonnější systém umělé inteligence od Googlu, který byl od počátku navržen jako „nativně multimodální“ – tedy schopný plynule pracovat s textem, kódem, zvukem, obrázky i videem.

Historie a vývoj

Cesta ke Gemini nebyla přímá a zahrnovala spojení dvou dříve konkurenčních laboratoří: Google Brain a DeepMind.

Úrovně modelů Gemini

Google zvolil strategii „jedno jméno, různé velikosti“, aby pokryl vše od mobilních telefonů po obří datová centra:

Verze Cílové zařízení Charakteristika
Gemini Nano Lokální zařízení (např. Pixel 8/9). Běží přímo na SoC telefonu bez internetu.
Gemini Flash Rychlé API a webové aplikace. Optimalizován pro rychlost a nízké náklady.
Gemini Pro Široká veřejnost a firemní zákazníci. Vyvážený poměr výkonu a schopností.
Gemini Ultra Nejsložitější výpočetní úlohy. Nejvýkonnější model pro vědecký výzkum a kódování.

Klíčové inovace: Kontextové okno

Jednou z největších předností Gemini je extrémně dlouhé kontextové okno. Zatímco běžné modely si „pamatují“ desítky stran textu, Gemini 1.5 Pro dokáže najednou zpracovat:

Současnost a integrace (2025–2026)

V současnosti je Gemini integrováno do celého ekosystému Google:

Související pojmy: ChatGPT, OpenAI, Hluboké učení, SoC