Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

V italské lidové pohádce se dřevěný, ale inteligentní panáček Pinocchio vyznačoval tím, že byl velmi špatný lhář. Pokaždé, když řekl nějakou nepravdu, o něco mu povyrostl nos. Dnešní umělé inteligence takový problém nemají. Za několik posledních let dosáhly obrovského pokroku ve všech oblastech. Včetně právě lhaní, upozornila nová studie.

Analýza vědců z Massachusettského technologického institutu (MIT) popsala případy, kdy systémy umělé inteligence podváděly své lidské oponenty, dokázaly blafovat a úspěšně předstírat, že jsou lidé. Jeden zkoumaný chatbot dokonce změnil své chování během bezpečnostních testů, což podle autorů zvyšuje riziko, že AI budou umět lidi přelstít poměrně snadno.

„S tím, jak budou schopnosti systémů AI lhát stále dokonalejší, bude nebezpečí, které představují pro společnost, stále vážnější,“ komentoval výsledky zkoumání autor studie Peter Park.

Lež jako cesta k vítězství

Park se rozhodl prověřit schopnosti AI lhát poté, co se dozvěděl o tom, jak je úspěšná ve stolní hře Diplomacy. Umělá inteligence Cicero od společnosti Meta se naučila, jak v ní porazit většinu lidských soupeřů – a protože je v této dobyvatelské strategii zapotřebí umět lhát a podvádět, musela si to osvojit.

AI to dokázala, přestože byla navržená tak, aby byla „převážně čestná“ a nikdy nepodrazila své lidské spoluhráče. Jenže k vítězství to nestačilo – a tak lhala. Park a jeho kolegové prošli veřejně dostupná data o hrách Cicera proti lidem a našli v nich několik případů, kdy umělá inteligence promyšleně lhala, pletichařila s hráči proti jiným, a dokonce maskovala svou AI povahu, když se jinému hráči omlouvala za zpoždění slovy, že „telefonovala se svou přítelkyní“. „Zjistili jsme, že umělá inteligence Meta se naučila mistrovsky podvádět,“ potvrzuje Park.

Jeho tým pak popsal podobné schopnosti i u jiných systémů AI, například u programu pro poker Texas Hold 'em, který dokázal blafovat proti profesionálním lidským hráčům. V jedné studii si umělé inteligence v digitálním simulátoru dokonce „hrály na mrtvé“, aby tak oklamaly test sestavený k eliminaci systémů umělé inteligence, které se vyvinuly k rychlému replikování. Po skončení testování obnovily svou původní činnost. To je podle autorů výjimečně znepokojivé, protože to ukazuje, jak složité mohou už brzy být snahy umělé inteligence kontrolovat.

Podle Parka to může mít zásadní důsledky. „To, že se systém umělé inteligence považuje za bezpečný v testovacím prostředí, ještě neznamená, že je bezpečný i potom v ostrém provozu. Může se stát, že v testovacím prostředí jenom předstírá, že je bezpečný,“ upozornil Park.

Vědci tyto nové informace zveřejnili v odborném žurnálu Patterns. Současně v článku vyzvali vlády, aby navrhly zákony o bezpečnosti umělé inteligence, které by se věnovaly právě problému podvodů ze stran AI. Varují mimo jiné před tím, že pokud tyto systémy dokáží svou schopnost lhát ještě více zdokonalit, mohli by nad nimi lidé snadno ztratit kontrolu.


Výběr redakce

Aktuálně z rubriky Věda

Nejdřív nevěřili, že ji vyprostí. Experti popsali záchranu relikvie z betonu

Přes šestnáct hodin trvalo restaurátorům Blance Valchářové a Michalu Velíškovi lebku svaté Zdislavy vyprostit z betonu, do kterého ji zalil zloděj. Relikvii ukradl z baziliky v Jablonném v Podještědí na Liberecku v úterý 12. května večer a chtěl ji pohřbít do řeky. V tom mu zabránil rychlý zásah policie. Očištěnou a zrestaurovanou lebku v sobotu restaurátoři předali arcibiskupovi Stanislavu Přibylovi při hlavní mši na Zdislavské pouti v Jablonném.
před 9 hhodinami

Na Mostecku vědci vysazují trávu s výhřevností uhlí

Travinu, která je schopna rychle růst i na kontaminovaných a na živiny chudých půdách, vysazuje tým vědců v okolí bývalého lomu ČSA na Mostecku. Z ozdobnice obrovské lze získat biomasu, která má výhřevnost srovnatelnou s hnědým uhlím.
před 16 hhodinami

Raketa společnosti Blue Origin explodovala při testu na startovací rampě

Raketa New Glenn společnosti Blue Origin miliardáře Jeffa Bezose explodovala při testu na startovací rampě, informují tiskové agentury. Veškerý personál je v bezpečí, ujistil Bezos s tím, že je ještě příliš brzy na zjištění, co se pokazilo. K výbuchu došlo ještě na startovací rampě, což je podle experta pro firmu o to závažnější.
29. 5. 2026Aktualizováno29. 5. 2026

Hurikánová sezona bude letos zřejmě slabší, stoupá hrozba tajfunů

S červnem začíná hurikánová sezona v Atlantiku. Oblast tropického oceánu, která je klíčová pro vývoj hurikánů, je teď sice nadprůměrně teplá, přesto meteorologové z amerického NOAA (Národního úřadu pro oceány a atmosféru) letos očekávají spíše klidnější průběh. Silné by naopak mohly být tajfuny v Pacifiku.
29. 5. 2026

AI pomohla rozluštit vatikánskou Borgovu šifru i další staré texty

Umělá inteligence (AI) pomáhá historikům odhalovat tajemství stovky let starých šifer ukrytých v archivech a knihovnách po celém světě. Díky novým algoritmům se daří rozluštit staré texty, které byly dosud nečitelné, a nahlédnout tak do světa tajných lékařských receptů, milostných dopisů i politických intrik, píše britská stanice BBC.
29. 5. 2026

Evropa se otepluje dvakrát rychleji než průměr světa. Současná vedra jsou dokladem

V Evropě tento týden padly teplotní rekordy mimo jiné ve Velké Británii, Irsku a Francii. Za horkem, které se obvykle vyskytuje až na vrcholu léta, stojí takzvaná „teplotní kopule“ teplého vzduchu ze severní Afriky, která se ocitla uvězněná pod tlakovou výší nad západní Evropou. A vliv má i fakt, že Evropa se otepluje výrazně rychleji než zbytek planety – každá další vlna veder je tak vzhledem k tomuto vyššímu základu intenzivnější.
29. 5. 2026

Komáři se umí naučit, že repelent znamená večeři, naznačuje studie

Skupina francouzských vědců popsala v odborném časopise Journal of Experimental Biology, že komáři přenášející žlutou zimnici se mohou naučit spojovat vůni nejpoužívanějšího repelentu s potravou. To znamená, že by mohli být ochotnější sát krev lidí, kteří repelent používají.
28. 5. 2026

V Brně ukazují pravěké rytiny a nové nálezy

Moravské zemské muzeum vystavilo v Pavilonu Anthropos nejvýznamnější nálezy svých archeologů z posledních deseti let. Dominuje rytina mamuta a koně na říčním valounu stará až patnáct tisíc let.
28. 5. 2026
Načítání...