
Digitální gigant Google podal žádost o patent pro pokročilé asistenty s umělou inteligencí, kteří dokážou během dialogu vnímat alespoň pět signálů o souvislostech z reálného světa včetně kontextových záměrů. Díky tomu vylepšují své odpovědi tak, aby měl uživatel co nejsilnější pocit, že komunikuje s jinou živou bytostí. Systém využívá uživatelská data, historii konverzace i signály o prostředí nebo záměru rozhovoru. Jestli už Google tuto technologii využívá v praxi, když ji chce chránit patentem, není zatím jisté.
Mluvené slovo, text i dotyky
Patentovaný systém má název Použití velkých jazykových modelů při generování odpovědí automatizovaných asistentů a zahrnuje pestrou škálu asistentů s AI přijímajících vstupy prostřednictvím řeči, textu a dotyků.
- „Je pozoruhodné, že během dané dialogové relace může uživatel interagovat s automatizovaným asistentem pomocí různých způsobů vstupu, včetně, ale nikoli výhradně mluveného vstupu, psaného textu a/nebo dotykového vstupu.“
Faktory ovlivňující upravené odpovědi velkých jazykových modelů (LLM):
- Čas, místo a prostředí,
- Uživatelská specifika,
- Záměr a cíl dialogu, předchozí komunikace,
- Vstupy (text, hlas, dotyk),
- Technické okolnosti.
Čas, místo a prostředí
Tyto tři kontextové faktory poskytují souvislosti, které nelze vyčíst z klíčových slov. Přímo ovlivňují reakce asistentů s umělou inteligencí, a i když se neprojevují v zánovních přehledech od AI ani v režimu umělé inteligence ve vyhledávání, názorně představují, jak se díky AI bude měnit naše práce s daty.
Příklad: Chcete si jít zahrát golf a sdělíte to svému AI asistentovi. Ten by vám standardně odpověděl něco ve smyslu, ať se vám hra daří a pěkně si ji užijete, případně by nabídl ještě tipy na nějakou další zábavu. Upravená odpověď LLM je však podstatně širší a vychází z geografické polohy a času. Díky tomu se můžete dozvědět, kde je nejbližší oblíbené golfové hřiště, jaké tam má být v následujících hodinách počasí i spoustu dalších užitečných informací.
V dokumentaci k patentu je jako příklad použitý surfař:
- „…upravené výstupy asistentů řídí dialogovou relaci způsobem, který dále zapojuje uživatele klientského zařízení do dialogové relace kladením kontextově relevantních otázek (např. Jak dlouho už surfujete?). Odpovědi poskytují kontextově relevantní informace (např. Pokud se znovu chystáte na pláž Example Beach, připravte se na mírné přeháňky) a/nebo jinak rezonují s uživatelem klientského zařízení v kontextu dialogové relace.“
Uživatelská specifika
Patent popisuje několik uživatelských příznaků, které LLM využijí k bohatější úpravě generovaného výstupu.
Mezi nimi jsou:
- Informace z uživatelského profilu jako třeba volnočasové aktivity, oblíbená jídla nebo kultura,
- Data ze softwarových aplikací, které aktuálně používáte nebo jste používali před nedávnem,
- Historie vaší komunikace (probíhající i dřívější) s AI asistentem.
Patentové podklady k tomu uvádí:
- „Kontext dialogové relace lze navíc určit na základě jednoho nebo více kontextových signálů, které zahrnují například okolní hluk detekovaný v blízkosti klientského zařízení, data uživatelského profilu, data softwarové aplikace, …historii dialogové relace mezi uživatelem a automatizovaným asistentem a/nebo jiné kontextové signály.“
Související záměry a cíle
Dokumenty k patentu také vysvětlují, jak LLM využijí jim známé preference uživatele k rozpoznání souvisejících záměrů se záměrem původního dotazu:
- „Například… jeden nebo více LLM může určit záměr spojený s daným asistentským dotazem… Dále jeden nebo více LLM může na základě záměru spojeného s daným asistentským dotazem identifikovat alespoň jeden související záměr, který souvisí se záměrem spojeným s daným asistentským dotazem... Navíc jeden nebo více LLM může na základě alespoň jednoho souvisejícího záměru vygenerovat další asistentský dotaz.“
Jako příklad posloužil uživatel, který oznamuje AI asistentovi, že má hlad. LLM najde relevantní příbuzné kontexty a zjistí, jakou kuchyni má uživatel nejraději, a které restaurace v okolí takové jídlo nabízí.
- „V takovém příkladu může dodatečný asistent odpovídat například na otázky typu: Jaký typ jídla uživatel uvedl, že upřednostňuje? (např. odráží související záměr typu kuchyně spojený se záměrem uživatele, který sdělil, že se potřebuje najíst), Jaké restaurace v blízkém okolí mají otevřeno? (např. odráží související záměr vyhledávání restaurace spojený se záměrem uživatele, který sdělil, že se potřebuje najíst)... V těchto implementacích lze na základě zpracování dotazu dodatečného asistenta určit další výstup asistenta.“
Systém a zařízení: technické okolnosti
Působivá je také část materiálu popisující souvislosti systému a zařízení. Umělá inteligence dokáže zjistit třeba to, jestli už je baterie v zařízení uživatele málo nabitá, a na základě toho vypne upravené odpovědi LLM vyžadující více výpočetní kapacity a energie.
Pokročilé technologie umí také poznat, že se od zařízení vzdalujete, a přizpůsobí tomu svou aktivitu v případných delších (hlasových) odpovědích. Vliv má také už zmíněný výpočetní výkon, kvalita internetového připojení i jiné faktory.
A ještě něco na cestu…
- Umělá inteligence využívá kontextové signály: Patentová dokumentace společnosti Google popisuje, jak mohou asistenti AI sbírat souvislosti z reálného světa při generování odpovědí a snaze o relevantnější ”lidštější” komunikaci.
- Související faktory ovlivňují reakce AI: Jsou to místo, čas a prostředí, jedinečné aspekty uživatele, záměr konverzace a její historie, technické podmínky a vstupy (text, hlas, dotyk).
- Upravené odpovědi LLM zvyšují interakci: Velké jazykové modely využívají kontextové souvislosti při tvorbě personalizovaných odpovědí a odpovědí na potenciální následné otázky, týkající se třeba informací z předešlých konverzací.
- Na co se můžeme těšit: Příklady, jako je upozornění na počasí při plánování venkovních aktivit nebo doporučení restaurace podle preferencí uživatele představují, jak umělá inteligence dokáže reagovat na dotazy v reálných souvislostech. Jaký to bude mít dopad na práci na SEO, to ukáže budoucnost.
Zdroj: searchengineland.com, searchenginejournal.com, marketingland.com, facebook.com, cpcstrategy.com
Autor: Martin Kulhánek
Foto zdroj: AI, pixabay.com