AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

Výběr redakce

Aktuálně z rubriky Věda

Nejdřív nevěřili, že ji vyprostí. Experti popsali záchranu relikvie z betonu

Přes šestnáct hodin trvalo restaurátorům Blance Valchářové a Michalu Velíškovi lebku svaté Zdislavy vyprostit z betonu, do kterého ji zalil zloděj. Relikvii ukradl z baziliky v Jablonném v Podještědí na Liberecku v úterý 12. května večer a chtěl ji pohřbít do řeky. V tom mu zabránil rychlý zásah policie. Očištěnou a zrestaurovanou lebku v sobotu restaurátoři předali arcibiskupovi Stanislavu Přibylovi při hlavní mši na Zdislavské pouti v Jablonném.
před 7 hhodinami

Na Mostecku vědci vysazují trávu s výhřevností uhlí

Travinu, která je schopna rychle růst i na kontaminovaných a na živiny chudých půdách, vysazuje tým vědců v okolí bývalého lomu ČSA na Mostecku. Z ozdobnice obrovské lze získat biomasu, která má výhřevnost srovnatelnou s hnědým uhlím.
před 14 hhodinami

Raketa společnosti Blue Origin explodovala při testu na startovací rampě

Raketa New Glenn společnosti Blue Origin miliardáře Jeffa Bezose explodovala při testu na startovací rampě, informují tiskové agentury. Veškerý personál je v bezpečí, ujistil Bezos s tím, že je ještě příliš brzy na zjištění, co se pokazilo. K výbuchu došlo ještě na startovací rampě, což je podle experta pro firmu o to závažnější.
včeraAktualizovánovčera v 13:16

Hurikánová sezona bude letos zřejmě slabší, stoupá hrozba tajfunů

S červnem začíná hurikánová sezona v Atlantiku. Oblast tropického oceánu, která je klíčová pro vývoj hurikánů, je teď sice nadprůměrně teplá, přesto meteorologové z amerického NOAA (Národního úřadu pro oceány a atmosféru) letos očekávají spíše klidnější průběh. Silné by naopak mohly být tajfuny v Pacifiku.
včera v 11:30

AI pomohla rozluštit vatikánskou Borgovu šifru i další staré texty

Umělá inteligence (AI) pomáhá historikům odhalovat tajemství stovky let starých šifer ukrytých v archivech a knihovnách po celém světě. Díky novým algoritmům se daří rozluštit staré texty, které byly dosud nečitelné, a nahlédnout tak do světa tajných lékařských receptů, milostných dopisů i politických intrik, píše britská stanice BBC.
včera v 10:20

Evropa se otepluje dvakrát rychleji než průměr světa. Současná vedra jsou dokladem

V Evropě tento týden padly teplotní rekordy mimo jiné ve Velké Británii, Irsku a Francii. Za horkem, které se obvykle vyskytuje až na vrcholu léta, stojí takzvaná „teplotní kopule“ teplého vzduchu ze severní Afriky, která se ocitla uvězněná pod tlakovou výší nad západní Evropou. A vliv má i fakt, že Evropa se otepluje výrazně rychleji než zbytek planety – každá další vlna veder je tak vzhledem k tomuto vyššímu základu intenzivnější.
včera v 09:12

Komáři se umí naučit, že repelent znamená večeři, naznačuje studie

Skupina francouzských vědců popsala v odborném časopise Journal of Experimental Biology, že komáři přenášející žlutou zimnici se mohou naučit spojovat vůni nejpoužívanějšího repelentu s potravou. To znamená, že by mohli být ochotnější sát krev lidí, kteří repelent používají.
28. 5. 2026

V Brně ukazují pravěké rytiny a nové nálezy

Moravské zemské muzeum vystavilo v Pavilonu Anthropos nejvýznamnější nálezy svých archeologů z posledních deseti let. Dominuje rytina mamuta a koně na říčním valounu stará až patnáct tisíc let.
28. 5. 2026
Načítání...