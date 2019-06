Přibližný věk, pohlaví i jazyk rozpozná umělá inteligence ze zvukového záznamu za několik sekund. Policii tak pomáhá třídit stovky nahrávek podvodníků, kteří přes telefon sjednávali mikropůjčky nebo si objednávali mobil. Speciální program vyvíjejí vědci z Vysokého učení technického v Brně se společností Phonexia. Praha 16:01 17. června 2019 Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Kopírovat do schránky Zavřít Podle Luboše Voříška z Kriminalistického ústavu přibývá sériových úvěrových podvodů, zloději se začínají specializovat. | Zdroj: Kriminalistický ústav

„Celý systém se dá výborně ovládat pomocí gest na trackpadu, čímž vám odpadá nutnost vozit externí myš,“ zní z testovací nahrávky, na které Martin Sedláček z firmy Phonexia ukazuje, jak program na rozpoznávání hlasu funguje.

Váš prohlížeč nepodporuje přehrávání audia. Přehrát 00:00 / 00:00 Vědci zkoušejí s umělou inteligencí experimentovat ještě víc a na základě hlasu zkoušejí sestavit i podobu člověka.

„Z nahrávky dokážeme zjistit, kolik je v ní řeči. Dále řečníka, který tam mluví, jazyk nebo dialekt, kterým mluví, a pak samozřejmě i do detailu jako věk a obsah hovoru,“ popisuje Sedláček.

Podle jeho kolegy, Miroslava Jirků, program umí částečně poznat i to, jak řečník fyzicky vypadá. „Pozná, jak má dlouhý hrtan, jak má postavené zuby, jak funguje jazyk, horní, spodní patro, dutiny. To je unikátní pro každého řečníka a tím pádem je ‚voiceprint‘ stejně jako otisk prstu unikátní,“ říká Jirků.

Právě proto program nezmate ani to, když někdo mění hlas, protože jeho řečové ústrojí je pořád stejné. Systém využívá například Kriminalistický ústav, letos musel projít už 1 500 nahrávek, což je skoro stejný počet jako za celý loňský rok dohromady. Podle Luboše Voříška z Kriminalistického ústavu totiž přibývá sériových úvěrových podvodů, zloději se začínají specializovat.

Podvodné nákupy

„Více se specializují na podvodné nákupy, například elektroniky, než přímo na úvěry, kde by získali rovnou finanční prostředky. Většinou se jedná o mobilní telefony, takovou tu užitkovou elektroniku. Dříve byly v módě pojistné podvody, to je teď víceméně vymýcené,“ dodává.

Program kriminalisté využívají na nahrávky z úvěrových společností, kde si člověk bere půjčku. Pokud řádně neplatí, tak to po oznámení začíná vyšetřovat policie. Ta vytipuje konkrétního pachatele a případ předá kriminalistům, kteří srovnávají nahrávky známých osob s neznámými.

Program letos začal využívat i umělou inteligenci, neboli hluboké neuronové sítě. „Program nakrmíte velkým množstvím audionahrávek, u kterých říkáte, kdo je řečníkem dané nahrávky. Na tomto se dokáže natrénovat natolik, že když mu potom přestanete říkat, kdo je řečník, už sám dokáže poznat, že tyto dvě nahrávky patří k jednomu člověku,“ vysvětluje Jirků. „Identifikace je přesnější a rychlejší, takže nám to snížilo počet porovnání. U nahrávek je to zkrácení řádově o 2 až 3 dny,“ dodává Voříšek.

Vědci teď zkoušejí s umělou inteligencí experimentovat ještě víc a na základě hlasu chtějí sestavit i podobu člověka. Podle Jana Černockého, vedoucího výzkumné skupiny Dolování dat z řeči na VUT v Brně, už první výsledky jsou a jeho skupina chce vývoj také zkusit. Policie by podle něj ale mohla v budoucnu program využívat i trochu jinak.

„Policie bude mít hlasová data podezřelého z jiných zdrojů. Ten člověk mohl někdy něco nahrát třeba na YouTube, nebo ho slyšeli někde v předchozích případech a dokážou ho ztotožnit pomocí předchozích nahrávek. To, že by měl někdo pětisekundový telefonát o bombě a program by nakreslil přesně jeho obličej, je prozatím science fiction,“ vysvětluje Černocký.

Už nyní brněnský program pomáhá nejen v Česku, ale i německé policii a bezpečnostním složkám v desítkách dalších států.