Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Nejdřív nevěřili, že ji vyprostí. Experti popsali záchranu relikvie z betonu

Přes šestnáct hodin trvalo restaurátorům Blance Valchářové a Michalu Velíškovi lebku svaté Zdislavy vyprostit z betonu, do kterého ji zalil zloděj. Relikvii ukradl z baziliky v Jablonném v Podještědí na Liberecku v úterý 12. května večer a chtěl ji pohřbít do řeky. V tom mu zabránil rychlý zásah policie. Očištěnou a zrestaurovanou lebku v sobotu restaurátoři předali arcibiskupovi Stanislavu Přibylovi při hlavní mši na Zdislavské pouti v Jablonném.
před 5 hhodinami

Na Mostecku vědci vysazují trávu s výhřevností uhlí

Travinu, která je schopna rychle růst i na kontaminovaných a na živiny chudých půdách, vysazuje tým vědců v okolí bývalého lomu ČSA na Mostecku. Z ozdobnice obrovské lze získat biomasu, která má výhřevnost srovnatelnou s hnědým uhlím.
před 12 hhodinami

Raketa společnosti Blue Origin explodovala při testu na startovací rampě

Raketa New Glenn společnosti Blue Origin miliardáře Jeffa Bezose explodovala při testu na startovací rampě, informují tiskové agentury. Veškerý personál je v bezpečí, ujistil Bezos s tím, že je ještě příliš brzy na zjištění, co se pokazilo. K výbuchu došlo ještě na startovací rampě, což je podle experta pro firmu o to závažnější.
včeraAktualizovánovčera v 13:16

Hurikánová sezona bude letos zřejmě slabší, stoupá hrozba tajfunů

S červnem začíná hurikánová sezona v Atlantiku. Oblast tropického oceánu, která je klíčová pro vývoj hurikánů, je teď sice nadprůměrně teplá, přesto meteorologové z amerického NOAA (Národního úřadu pro oceány a atmosféru) letos očekávají spíše klidnější průběh. Silné by naopak mohly být tajfuny v Pacifiku.
včera v 11:30

AI pomohla rozluštit vatikánskou Borgovu šifru i další staré texty

Umělá inteligence (AI) pomáhá historikům odhalovat tajemství stovky let starých šifer ukrytých v archivech a knihovnách po celém světě. Díky novým algoritmům se daří rozluštit staré texty, které byly dosud nečitelné, a nahlédnout tak do světa tajných lékařských receptů, milostných dopisů i politických intrik, píše britská stanice BBC.
včera v 10:20

Evropa se otepluje dvakrát rychleji než průměr světa. Současná vedra jsou dokladem

V Evropě tento týden padly teplotní rekordy mimo jiné ve Velké Británii, Irsku a Francii. Za horkem, které se obvykle vyskytuje až na vrcholu léta, stojí takzvaná „teplotní kopule“ teplého vzduchu ze severní Afriky, která se ocitla uvězněná pod tlakovou výší nad západní Evropou. A vliv má i fakt, že Evropa se otepluje výrazně rychleji než zbytek planety – každá další vlna veder je tak vzhledem k tomuto vyššímu základu intenzivnější.
včera v 09:12

Komáři se umí naučit, že repelent znamená večeři, naznačuje studie

Skupina francouzských vědců popsala v odborném časopise Journal of Experimental Biology, že komáři přenášející žlutou zimnici se mohou naučit spojovat vůni nejpoužívanějšího repelentu s potravou. To znamená, že by mohli být ochotnější sát krev lidí, kteří repelent používají.
28. 5. 2026

V Brně ukazují pravěké rytiny a nové nálezy

Moravské zemské muzeum vystavilo v Pavilonu Anthropos nejvýznamnější nálezy svých archeologů z posledních deseti let. Dominuje rytina mamuta a koně na říčním valounu stará až patnáct tisíc let.
28. 5. 2026
Načítání...