Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

Tomáš Karlík

16. 5. 2024‌‌|Zdroj: ČT24, Guardian, Patterns

V italské lidové pohádce se dřevěný, ale inteligentní panáček Pinocchio vyznačoval tím, že byl velmi špatný lhář. Pokaždé, když řekl nějakou nepravdu, o něco mu povyrostl nos. Dnešní umělé inteligence takový problém nemají. Za několik posledních let dosáhly obrovského pokroku ve všech oblastech. Včetně právě lhaní, upozornila nová studie.

Analýza vědců z Massachusettského technologického institutu (MIT) popsala případy, kdy systémy umělé inteligence podváděly své lidské oponenty, dokázaly blafovat a úspěšně předstírat, že jsou lidé. Jeden zkoumaný chatbot dokonce změnil své chování během bezpečnostních testů, což podle autorů zvyšuje riziko, že AI budou umět lidi přelstít poměrně snadno.

„S tím, jak budou schopnosti systémů AI lhát stále dokonalejší, bude nebezpečí, které představují pro společnost, stále vážnější,“ komentoval výsledky zkoumání autor studie Peter Park.

Lež jako cesta k vítězství

Park se rozhodl prověřit schopnosti AI lhát poté, co se dozvěděl o tom, jak je úspěšná ve stolní hře Diplomacy. Umělá inteligence Cicero od společnosti Meta se naučila, jak v ní porazit většinu lidských soupeřů – a protože je v této dobyvatelské strategii zapotřebí umět lhát a podvádět, musela si to osvojit.

Když není svěcená voda, křtěte limonádou, doporučoval AI kněz. Tvůrci mu sebrali kolárek

AI to dokázala, přestože byla navržená tak, aby byla „převážně čestná“ a nikdy nepodrazila své lidské spoluhráče. Jenže k vítězství to nestačilo – a tak lhala. Park a jeho kolegové prošli veřejně dostupná data o hrách Cicera proti lidem a našli v nich několik případů, kdy umělá inteligence promyšleně lhala, pletichařila s hráči proti jiným, a dokonce maskovala svou AI povahu, když se jinému hráči omlouvala za zpoždění slovy, že „telefonovala se svou přítelkyní“. „Zjistili jsme, že umělá inteligence Meta se naučila mistrovsky podvádět,“ potvrzuje Park.

Jeho tým pak popsal podobné schopnosti i u jiných systémů AI, například u programu pro poker Texas Hold 'em, který dokázal blafovat proti profesionálním lidským hráčům. V jedné studii si umělé inteligence v digitálním simulátoru dokonce „hrály na mrtvé“, aby tak oklamaly test sestavený k eliminaci systémů umělé inteligence, které se vyvinuly k rychlému replikování. Po skončení testování obnovily svou původní činnost. To je podle autorů výjimečně znepokojivé, protože to ukazuje, jak složité mohou už brzy být snahy umělé inteligence kontrolovat.

Podle Parka to může mít zásadní důsledky. „To, že se systém umělé inteligence považuje za bezpečný v testovacím prostředí, ještě neznamená, že je bezpečný i potom v ostrém provozu. Může se stát, že v testovacím prostředí jenom předstírá, že je bezpečný,“ upozornil Park.

Vědci tyto nové informace zveřejnili v odborném žurnálu Patterns. Současně v článku vyzvali vlády, aby navrhly zákony o bezpečnosti umělé inteligence, které by se věnovaly právě problému podvodů ze stran AI. Varují mimo jiné před tím, že pokud tyto systémy dokáží svou schopnost lhát ještě více zdokonalit, mohli by nad nimi lidé snadno ztratit kontrolu.

Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

Lež jako cesta k vítězství

Výběr redakce

Marocká vláda se poprvé vyjádřila ke krizi v Ceutě, obvinila z ní pašeráky

Ukrajina zasáhla ruskou leteckou základnu, rafinerii i další sklad Wildberries

Exploze u restaurace v Moskvě zabíjela, zamýšleným terčem mohl být ruský generál

Při nehodě přišla o část nohy. Život může na motorce zachránit i kvalitní výbava

V Řecku se při hašení srazily vrtulníky, dva mrtví. Požáry trápí i část USA

Úřady v Gaze hlásí, že Izrael za dva dny zabil v Pásmu přes dvacet lidí

Zdravotnictví na Kubě kolabuje. Chybí léky i doktoři, na operaci čekají tisíce lidí

Češi kvůli špatné distribuční sazbě často přeplácí za elektřinu, ukázala analýza

Aktuálně z rubriky Věda

Vědci objevili v Amazonii pozůstatky neznámé starověké civilizace

„První Evropané“ byli kanibalové, ale nejedli jen děti, naznačuje výzkum

Teplotní rekordy v pátek padly na dvou třetinách stanic

Maďarsko se chystá na úplné odstavení své jediné jaderné elektrárny

AI od Anthropicu se při testech nabourala do systémů tří firem

Srpen bude teplý, naznačují předpovědi. Jeho začátek přinese tropické noci

Dopady silného jevu El Niño by se mohly projevit i v Estonsku

Vědci z Česka popsali gen, který pomáhá rostlinám zvládat sucho

Evropský pohled

Student, který v Singapuru olízl brčko a vrátil ho do automatu, se vyhnul vězení

Pracovní život Estonců by se mohl prodloužit na skoro 45 let, ukazuje prognóza

„Situace se výrazně zhoršila.“ Slovjansk čelí novým ruským dronům i sílícímu ostřelování

Dopady silného jevu El Niño by se mohly projevit i v Estonsku

Arménie hledá alternativy k Rusku. Může hlasovat i o vstupu do EU, řekl Pašinjan

Španělsko čeká první úplné zatmění po více než století. Takto prožívalo ta poslední

První nehoda dálkově ovládaného taxi vyvolává v Estonsku otázky o odpovědnosti

Nová tvář italské krajní pravice Vannacci sází na provokaci

Francouzi masově stahují aplikaci sledující lesní požáry

Nová litevská vláda chce zpřísnit pravidla migrace. Kritici varují před dopady na ekonomiku

„Z dvaceti levů se stalo dvacet eur.“ Bulhaři po přijetí eura utrácejí víc, vklady přesto rostou

Ruské údery ochromily lodní dopravu do ukrajinských přístavů. Co bude s vývozem obilí?

Vlaky v Lotyšsku jezdí na čas, zpoždění ale mají nástupiště

Německo povolilo výrobu jaderného paliva na základě licence udělené Rosatomem

Litva patří mezi země EU, které čelí nejprudšímu poklesu počtu obyvatel

Běloruský soud označil polskou organizaci pomáhající migrantům za extremistickou

V rodném domě Adolfa Hitlera v Rakousku nyní sídlí policejní stanice

„Milostní“ podvodníci za sebou zanechávají zlomená srdce a finanční krach

Většina Poláků je proti obnovení povinné vojenské služby, ukázal průzkum

Od stíhačů po kulomety. Takto ukrajinské jednotky cvičí sestřelování ruských dronů

V lotyšských ozbrojených silách za incident s dronem nebude nikdo potrestán

V Irsku o polovinu přibylo dětí, které se vážně zranily při nehodách na elektrokoloběžkách

Novináři odhalili internetový nábor sabotérů pro akce v Evropě

Vědce v Lotyšsku znepokojuje možné ohrožení akademické svobody