ChatGPT (Chat Generative Pre-trained Transformer) je chatbot založený na velkém jazykovém modelu (LLM) vyvinutý společností OpenAI. Od svého uvedení v listopadu 2022 způsobil revoluci v tom, jak lidé interagují s počítači, generují text, programují a vyhledávají informace.
Z technického hlediska nejde o „vyhledávač“, ale o prediktivní model, který na základě kontextu odhaduje nejpravděpodobnější následující slovo (token).
ChatGPT stojí na třech technologických pilířích:
Je to typ architektury hlubokého učení, která využívá mechanismus pozornosti (Attention). To umožňuje modelu chápat vztahy mezi slovy v dlouhých větách, i když jsou od sebe daleko (např. shoda podmětu s přísudkem na konci odstavce).
Model byl trénován na obrovském množství textových dat z internetu (knihy, články, kód). Během této fáze se naučil gramatiku, fakta i různé styly psaní.
Klíčový krok, který udělal z ChatGPT užitečného pomocníka. Lidé hodnotili odpovědi modelu, čímž ho učili:
OpenAI modely neustále vyvíjí. Každá nová verze vyžaduje výkonnější hardware od firmy NVIDIA, vyráběný v TSMC.
| Verze | Hlavní přínos |
|---|---|
| GPT-3.5 | První verze dostupná zdarma, rychlá, ale náchylná k chybám. |
| GPT-4 | Multimodální model (chápe i obrázky), mnohem vyšší přesnost a logické uvažování. |
| GPT-4o / o1 | Modely s nativní podporou hlasu, videa a schopností hlubšího „přemýšlení“ před odpovědí. |
ChatGPT změnil několik oblastí:
— Související pojmy: Hluboké učení, SoC, TSMC, Broadcom (síťové prvky pro AI)