Hlavní obsah

Pokročilá umělá inteligence trpí naprostým kolapsem přesnosti, zjistila studie

3:04
3:04

Poslechněte si tento článek

Výzkumníci společnosti Apple zjistili zásadní slabinu špičkových modelů umělé inteligence. Podle nich dochází u velkých modelů uvažování (LRM) k úplnému zhroucení přesnosti při řešení komplexních problémů. To vyvolává pochybnosti o možnosti dosažení obecné umělé inteligence (AGI), která by se vyrovnala lidské inteligenci.

Foto: Profimedia.cz

Anthropic Claude 3.7 Sonnet-Thinking je jedním z LRM modelů, který vědci testovali.

Článek

Ve studii s názvem Iluze myšlení zveřejněné před několika dny vědci uvedli, že běžné modely umělé inteligence (LLM) si vedly lépe než modely uvažování (LRM) při řešení jednoduchých úkolů. Naopak u složitějších problémů selhaly oba typy modelů, píše web The Guardian.

Zároveň modely neefektivně využívaly výpočetní výkon – snažily se totiž najít správné řešení jednodušších úloh už v rané fázi uvažování, místo aby postupovaly promyšleně. U náročnějších problémů pak modely nejprve zkoumají nesprávná řešení a ke správným závěrům dospívají až později.

V rámci složitějších úkolů však modely zažívaly tzv. kolaps a nedokázaly vygenerovat žádné správné řešení. V jednom z experimentů dokonce selhaly i tehdy, když měly k dispozici speciální algoritmus, který by problém vyřešil.

„Velké modely uvažování se snaží řešit složité otázky rozkladem na menší kroky a generováním podrobných úvah. Když ale začne jejich výkon klesat, snižují i své úsilí o racionální uvažování. To je obzvlášť znepokojivé,“ vysvětlili autoři studie.

„To ukazuje na zásadní omezení v možnosti rozšiřování myšlenkových schopností současných vyspělejších modelů,“ doplnili.

Výzkumníci testovali modely OpenAI o3, Google Gemini Thinking, Anthropic Claude 3.7 Sonnet-Thinking a DeepSeek-R1. Všechny společnosti byly požádány o komentář, ale zatím se nikdo nevyjádřil.

AI modely mají své limity

Podle samotných vědců tyto AI modely zřejmě dosáhly svých nynějších limitů. „Zjištění zpochybňují běžně přijímané představy o schopnostech LRM a naznačují, že současné přístupy mohou narážet na vážné bariéry při snaze o obecně použitelné uvažování,“ napsali ve svém článku vědci.

Andrew Rogoyski z Institutu pro umělou inteligenci na univerzitě v Surrey a americký akademik Gary Marcus doplnili, že studie společnosti Apple signalizuje stálé tápání v oblasti obecné umělé inteligence (AGI).

„Zjištění, že velké modely uvažování ztrácejí přehled o složitých problémech, zatímco u problémů střední a nízké složitosti fungují dobře, naznačuje, že se v současných přístupech nacházíme v potenciální slepé uličce,“ uvedl Rogoyski.

„Kdokoli si myslí, že velké jazykové modely jsou přímou cestou k obecné umělé inteligenci (AGI), která by mohla zásadně změnit společnost k lepšímu, se klamou,“ dodal americký akademik Gary Marcus. Cesta k AGI tak zřejmě bude trvat déle, než si vývojáři mysleli.

Rozsáhlé modely uvažování představují nový typ systémů umělé inteligence, které před samotnou odpovědí dokážou vytvářet podrobné myšlenkové postupy. Díky schopnosti rozkládat problémy a poskytovat přehledné uvažování jsou tyto modely lépe srozumitelné a údajně i méně náchylné k chybám, píše web The Forbes.

Velké jazykové modely (LLM) vs. velké modely uvažování (LRM)

Velké jazykové modely (LLM) jako je GPT-3 přinesly revoluci ve způsobu, jakým stroje chápou a vytvářejí lidský jazyk. Jsou navrženy tak, aby zpracovávaly a vytvářely text, dokázaly psát eseje, odpovídat na otázky, a dokonce vytvářet poezii.

Jejich hlavní funkce se však točí kolem rozpoznávání vzorů a statistických předpovědí založených na rozsáhlých souborech dat.

LLM tedy vynikají v generování textu podobného lidskému, ale často jim chybí hlubší porozumění kontextu nebo schopnost uvažovat nad rámec povrchních dat.

Velké modely uvažování (LRM) také generují text a chápou kontext, ale navíc se zapojují do komplexních argumentačních procesů. Jejich cílem je napodobit lidské myšlení, analyzovat situace, vyvozovat logické závěry a činit informovaná rozhodnutí.

Tento vývoj je podobný tomu, když se student učí nejen memorovat fakta, ale také používat kritické myšlení při řešení problémů.

LRM tedy staví na architektuře velkých jazykových modelů a integrují sofistikované algoritmy, které umožňují uvažování, včetně začlenění pravidel a logických rámců pro racionální rozhodování.

Dále využívají bázi rozumových znalostí (přístup k rozsáhlým úložištím lidských znalostí na podporu uvažování) a kauzální odvozování (pochopení vztahů příčina-následek pro přesné předvídání výsledků).

Výběr článků

Načítám