Gemini je rodina multimodálních velkých jazykových modelů (LLM) vyvinutých společností Google DeepMind. Představuje nejvýkonnější systém umělé inteligence od Googlu, který byl od počátku navržen jako „nativně multimodální“ – tedy schopný plynule pracovat s textem, kódem, zvukem, obrázky i videem.
Cesta ke Gemini nebyla přímá a zahrnovala spojení dvou dříve konkurenčních laboratoří: Google Brain a DeepMind.
Google zvolil strategii „jedno jméno, různé velikosti“, aby pokryl vše od mobilních telefonů po obří datová centra:
| Verze | Cílové zařízení | Charakteristika |
|---|---|---|
| Gemini Nano | Lokální zařízení (např. Pixel 8/9). | Běží přímo na SoC telefonu bez internetu. |
| Gemini Flash | Rychlé API a webové aplikace. | Optimalizován pro rychlost a nízké náklady. |
| Gemini Pro | Široká veřejnost a firemní zákazníci. | Vyvážený poměr výkonu a schopností. |
| Gemini Ultra | Nejsložitější výpočetní úlohy. | Nejvýkonnější model pro vědecký výzkum a kódování. |
Jednou z největších předností Gemini je extrémně dlouhé kontextové okno. Zatímco běžné modely si „pamatují“ desítky stran textu, Gemini 1.5 Pro dokáže najednou zpracovat:
V současnosti je Gemini integrováno do celého ekosystému Google:
— Související pojmy: ChatGPT, OpenAI, Hluboké učení, SoC