lam
Obsah
LAM (Large Action Model)
LAM je typ modelu umělé inteligence navržený tak, aby porozuměl lidským záměrům a dokázal je autonomně realizovat prostřednictvím interakce s uživatelským rozhraním (UI) aplikací a webových stránek.
Namísto toho, aby model pouze popsal, jak něco udělat, LAM se sám přihlásí do aplikace, klikne na tlačítka, vyplní formuláře a úkol dokončí.
Rozdíl mezi LLM a LAM
| Vlastnost | LLM (např. GPT-4) | LAM (např. Rabbit R1 OS) |
|---|---|---|
| Hlavní výstup | Text, kód, obrázky | Akce (kliknutí, nákup, rezervace) |
| Pracovní prostor | Pravděpodobnost slov | Uživatelská rozhraní (UI) aplikací |
| Příklad | Napíše recept na pizzu | Objedná pizzu přes aplikaci |
Jak LAM funguje?
Tradiční automatizace (jako API) vyžaduje, aby vývojáři propojili každý systém zvlášť. LAM se však učí jinak:
- Pozorování UI: Model se učí sledováním toho, jak lidé používají aplikace (kde jsou tlačítka „Koupit“, „Hledat“ atd.).
- Pochopení struktury: Dokáže interpretovat vizuální prvky a logiku aplikací, i když se jejich vzhled mírně změní.
- Mapování záměru na akci: Přeloží požadavek v přirozeném jazyce („Najdi mi nejlevnější let do Londýna“) na sekvenci technických kroků v prohlížeči nebo aplikaci.
Hlavní výhody
- Univerzálnost: Nepotřebuje oficiální API od výrobce aplikace – ovládá ji jako člověk.
- Komplexní workflow: Dokáže propojit více aplikací dohromady (např. vzít data z Excelu, vložit je do CRM a poslat o tom zprávu na Slack).
- Jednoduchost pro uživatele: Uživatel nemusí umět ovládat 50 různých aplikací, stačí mu hlasový nebo textový příkaz.
Známé implementace a příklady
- Rabbit R1: Kapesní zařízení, které bylo postaveno na konceptu LAM (předvádělo objednávání jídla či Uberu).
- Browser-based Agents: Modely jako MultiOn nebo Skyvern, které dokáží samostatně procházet web a vyřizovat nákupy nebo administrativu.
- OpenAI (Operator): Chystané nástroje, které umožní ChatGPT přímo ovládat váš počítač.
—
Výzvy a rizika
Bezpečnost: Pokud dáte LAMu přístup ke svým účtům, model může teoreticky provést nechtěné nákupy nebo smazat data.
Spolehlivost: Pokud webová stránka změní design, model se může splést a kliknout na špatné místo.
Související: AI agent, LLM, RPA (Robotic Process Automation)
lam.txt · Poslední úprava: autor: admin
