AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Tomáš Karlík

19. 12. 2024‌‌|Zdroj: BMJ

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Svět se místy o tři stupně ohřeje rychleji, než se čekalo, předpovídá AI

Horko letos vyvolalo rekordní sucha v Amazonii

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Lidé jsou palivo, v hudební branži je AI připraví o čtvrtinu příjmu, tvrdí studie

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

AI našla na planině Nazca kosatku s nožem a stovky dalších obrazců

Obrazec kosatky s nožem na planině Nazca

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Pokles schopností

Vítězové a poražení

Rozdíly mezi mozkem a jazykovým modelem

Výběr redakce

V Řecku se při hašení srazily dva vrtulníky. Požáry trápí i stát Washington

Češi kvůli špatné distribuční sazbě často přeplácí za elektřinu, ukázala analýza

Ukrajina zasáhla ruskou leteckou základnu, rafinerii i další sklad Wildberries

Exploze u restaurace v Moskvě zabíjela, zamýšleným terčem mohl být ruský generál

Izrael za dva dny zabil v Pásmu Gazy sedmnáct lidí, tvrdí palestinské úřady

U ženy, která přicestovala z Ugandy, se nebezpečná nákaza neprokázala

Trump: USA a Izrael odloží chystané tvrdé údery na Írán

Maďarsko kvůli nízké hladině Dunaje zcela odstaví jadernou elektrárnu Paks

Aktuálně z rubriky Věda

Vědci objevili v Amazonii pozůstatky neznámé starověké civilizace

„První Evropané“ byli kanibalové, ale nejedli jen děti, naznačuje výzkum

Teplotní rekordy v pátek padly na dvou třetinách stanic

Maďarsko se chystá na úplné odstavení své jediné jaderné elektrárny

AI od Anthropicu se při testech nabourala do systémů tří firem

Srpen bude teplý, naznačují předpovědi. Jeho začátek přinese tropické noci

Dopady silného jevu El Niño by se mohly projevit i v Estonsku

Vědci z Česka popsali gen, který pomáhá rostlinám zvládat sucho

Evropský pohled

Student, který v Singapuru olízl brčko a vrátil ho do automatu, se vyhnul vězení

Pracovní život Estonců by se mohl prodloužit na skoro 45 let, ukazuje prognóza

„Situace se výrazně zhoršila.“ Slovjansk čelí novým ruským dronům i sílícímu ostřelování

Dopady silného jevu El Niño by se mohly projevit i v Estonsku

Arménie hledá alternativy k Rusku. Může hlasovat i o vstupu do EU, řekl Pašinjan

Španělsko čeká první úplné zatmění po více než století. Takto prožívalo ta poslední

První nehoda dálkově ovládaného taxi vyvolává v Estonsku otázky o odpovědnosti

Nová tvář italské krajní pravice Vannacci sází na provokaci

Francouzi masově stahují aplikaci sledující lesní požáry

Nová litevská vláda chce zpřísnit pravidla migrace. Kritici varují před dopady na ekonomiku

„Z dvaceti levů se stalo dvacet eur.“ Bulhaři po přijetí eura utrácejí víc, vklady přesto rostou

Ruské údery ochromily lodní dopravu do ukrajinských přístavů. Co bude s vývozem obilí?

Vlaky v Lotyšsku jezdí na čas, zpoždění ale mají nástupiště

Německo povolilo výrobu jaderného paliva na základě licence udělené Rosatomem

Litva patří mezi země EU, které čelí nejprudšímu poklesu počtu obyvatel

Běloruský soud označil polskou organizaci pomáhající migrantům za extremistickou

V rodném domě Adolfa Hitlera v Rakousku nyní sídlí policejní stanice

„Milostní“ podvodníci za sebou zanechávají zlomená srdce a finanční krach

Většina Poláků je proti obnovení povinné vojenské služby, ukázal průzkum

Od stíhačů po kulomety. Takto ukrajinské jednotky cvičí sestřelování ruských dronů

V lotyšských ozbrojených silách za incident s dronem nebude nikdo potrestán

V Irsku o polovinu přibylo dětí, které se vážně zranily při nehodách na elektrokoloběžkách

Novináři odhalili internetový nábor sabotérů pro akce v Evropě

Vědce v Lotyšsku znepokojuje možné ohrožení akademické svobody