Uživatelské nástroje

Nástroje pro tento web


lam

LAM (Large Action Model)

LAM je typ modelu umělé inteligence navržený tak, aby porozuměl lidským záměrům a dokázal je autonomně realizovat prostřednictvím interakce s uživatelským rozhraním (UI) aplikací a webových stránek.

Namísto toho, aby model pouze popsal, jak něco udělat, LAM se sám přihlásí do aplikace, klikne na tlačítka, vyplní formuláře a úkol dokončí.

Rozdíl mezi LLM a LAM

Vlastnost LLM (např. GPT-4) LAM (např. Rabbit R1 OS)
Hlavní výstup Text, kód, obrázky Akce (kliknutí, nákup, rezervace)
Pracovní prostor Pravděpodobnost slov Uživatelská rozhraní (UI) aplikací
Příklad Napíše recept na pizzu Objedná pizzu přes aplikaci

Jak LAM funguje?

Tradiční automatizace (jako API) vyžaduje, aby vývojáři propojili každý systém zvlášť. LAM se však učí jinak:

  • Pozorování UI: Model se učí sledováním toho, jak lidé používají aplikace (kde jsou tlačítka „Koupit“, „Hledat“ atd.).
  • Pochopení struktury: Dokáže interpretovat vizuální prvky a logiku aplikací, i když se jejich vzhled mírně změní.
  • Mapování záměru na akci: Přeloží požadavek v přirozeném jazyce („Najdi mi nejlevnější let do Londýna“) na sekvenci technických kroků v prohlížeči nebo aplikaci.

Hlavní výhody

  • Univerzálnost: Nepotřebuje oficiální API od výrobce aplikace – ovládá ji jako člověk.
  • Komplexní workflow: Dokáže propojit více aplikací dohromady (např. vzít data z Excelu, vložit je do CRM a poslat o tom zprávu na Slack).
  • Jednoduchost pro uživatele: Uživatel nemusí umět ovládat 50 různých aplikací, stačí mu hlasový nebo textový příkaz.

Známé implementace a příklady

  • Rabbit R1: Kapesní zařízení, které bylo postaveno na konceptu LAM (předvádělo objednávání jídla či Uberu).
  • Browser-based Agents: Modely jako MultiOn nebo Skyvern, které dokáží samostatně procházet web a vyřizovat nákupy nebo administrativu.
  • OpenAI (Operator): Chystané nástroje, které umožní ChatGPT přímo ovládat váš počítač.

Výzvy a rizika

Bezpečnost: Pokud dáte LAMu přístup ke svým účtům, model může teoreticky provést nechtěné nákupy nebo smazat data.
Spolehlivost: Pokud webová stránka změní design, model se může splést a kliknout na špatné místo.

Související: AI agent, LLM, RPA (Robotic Process Automation)

lam.txt · Poslední úprava: autor: admin