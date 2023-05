Jeden řečník, pět tlumočníků a simultánní tlumočení do více než 40 jazyků. To dokáže systém Elitr, evropský on-line překladatel, u jehož zrodu stáli odborníci z Matematicko-fyzikální fakulty Univerzity Karlovy. Je určený pro konference a každé slovo pronesené řečníkem musí během několika milisekund proběhnout skoro celou Evropou, aby si je lidé mohli vzápětí přečíst na mobilu. Magazín Experiment Praha 16:22 20. května 2023 Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Kopírovat do schránky Zavřít Evropský parlament - tlumočníci | Foto: europa.eu

„Teď se díváme na výstup našeho systému. Jakékoli slovo řeknu, objeví se v prvním sloupečku s češtinou, a to velmi rychle. Z češtiny to překládá do angličtiny,“ ukazuje Ondřej Bojar z Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy.

„Vedle toho je tabulka, kde si může uživatel vybrat kterýkoli z těch dalších celkem 42 jazyků a začnou s tam objevovat i překlady v různých jazycích,“ pokračuje Bojar.

Je mezi nimi možné různě přepínat. Dominik Macháček, doktorand, který je Bojarovi k ruce, přístroj nastavil, a když přepne na čtvereček KK, znamená to kazachštinu, která se ukazuje v azbuce. Kromě toho umí systém samozřejmě taky latinku, hebrejštinu nebo arabské písmo.

Ze čtverečku do čtverečku

Evropský živý překladatel Elitr vznikl na základě požadavku českého Nejvyššího kontrolního úřadu, který chystal velký mezinárodní kongres.

„Sestavili jsme plán, jak během tříletého projektu připravíme systémy tak, aby dokázaly sledovat živé slovo hlavního řečníka, a jako zálohu také současně přítomné simultánní tlumočníky, z více zdrojů budeme živě zobrazovat překlad mluveného slova,“ prozrazuje Bojar.

Český tým v čele s Ondřejem Bojarem se spojil se zahraničními kolegy a vytvořil systém, který s využitím obrovské slovní zásoby jednotlivých jazyků pro strojové učení vytváří desítky překladů najednou.

„Uvnitř to funguje tak, že jeden natrénovaný model máme připravený, aby vyráběl výstup ve všech jazycích najednou. Dáme mu tu samou větu 42krát a řekne se mu, tuto anglickou větu přelož do češtiny, do ázerbájdžánštiny, do bulharštiny. A protože grafická karta je zvyklá pracovat paralelně, tak do všech těchto jazyků přijde odpověď najednou," vysvětluje Bojar.

Během několika milisekund slovo vyřčené v České republice projde celkem devíti systémy, a to i ve Skotsku, Itálii a Německu.

„To se dělo v reálném čase, čili když jedno slovo bylo dořečeno, v tu chvíli se objevilo na obrazovce, a to celé stihlo proběhnout Evropu,“ dodává Bojar.

Budoucnost Elitru

Pro tlumočení na konferencích je důležité, aby se on-line překlad vytvářel průběžně po slovech, a nikoli po větách.

Ondřej Bojar s doktorandem Dominikem Macháčkem | Foto: Eva Kézrová | Zdroj: Český rozhlas

Do budoucna by měl systém dělat z přednášky relevantní poznámky ve všech jazycích. Doktorand Macháček teď pracuje na zkvalitnění výsledného překladu, a to díky kombinaci slov řečníka a tlumočníků.

„Například české slovo zámek může znamenat zámek-budovu a věc na zamykání, a když zároveň k tomu dostaneme anglickou větu, tak víme, která věc to je, a to už se může líp přeložit do dalšího jazyka,“ říká Macháček.

Vzhledem k hardwarové náročnosti překladatelský systém Elitr zatím nebude mobilní aplikací.