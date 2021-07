Řeč je to, co nás odlišuje nejen od zvířat. Důležité je nejen to, co říkáme, ale i to, jakým způsobem mluvíme. Co všechno už dnes umí rozklíčovat takzvané řečové technologie? „Kdyby nás ten přístroj slyšel už dřív, tak by nás měl zaregistrované, my říkáme enrolované. Takže by dokázal ověřit, jestli se v rozhovoru skutečně objevujeme my dva, nebo jestli to je někdo jiný,“ vyzdvihuje jednu z dovedností technologií vědec Jan Černocký. Brno 10:24 17. července 2021 Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Kopírovat do schránky Zavřít Emoce v rozhovoru technologie zatím určit neumí, na jejich určení by se ostatně nemuseli shodnout ani lidé | Zdroj: Shutterstock

Černocký vede Ústav počítačové grafiky a multimédií na Fakultě informačních technologií VUT v Brně a jeho výzkumná skupina se snaží získat z lidské řeči veškeré možné informace.

„První, co asi každého napadne, je přepis – a abychom to nemuseli přepisovat ručně, dá se spustit rozpoznávač řeči,“ připouští.

Podle Černockého existují ale i zajímavější technologie. „Kdybychom měli i mononahrávku našeho rozhovoru, dokáže rozkouskovat řeč na segmenty, kde mluvíte vy i já, a to dokonce bez toho, aby nás předtím slyšel. Protože běžně pracuje s předem neviděnými mluvčími, kdy se snaží nahrávku rozdělit do segmentů podle toho, kde mluví různí lidé,“ říká.

Pohlaví i věk

Bez toho, aby nás přístroj viděl, dokáže spolehlivě poznat naše pohlaví, s odchylkou pěti až sedmi let i určit věk mluvčích.

„Přepis řeči bychom ale mohli pustit do technologií přirozeného jazyka, které by se zabývalo sémantikem i i významem toho, co jsme řekli v jednotlivých větách. Taky ale i účel, proč jsme to tedy řekli,“ vysvětluje Černocký. To je podle něj důležité ve chvíli, kdy někdo zavolá do klientského centra, kde potřebuje něco vyřídit. A tam by mohly nastoupit právě technologie.

„A když se podíváme ještě výš, tak bychom dokázali určit, jak ten dialog probíhal – kdo mluvil jak dlouho, kdo komu skákal do řeči, kdo třeba začínal silnějším hlasem. Takže asi bychom dokázali odhadnout, kdo byl v rozhovoru dominantní i další sociální role účastníků – a bylo by toho ještě víc,“ prozrazuje vědec Černocký.

Emoce v rozhovoru ale technologie zatím určit neumí, na jejich určení by se ostatně nemuseli shodnout ani lidé.