Projektu Gott navždy se podařilo vytvořit hlas Karla Gotta pomocí umělé inteligence. V nejužším týmu, pod nímž celý projekt obživl, působil i Aleš Vrzák, šéfrežisér Českého rozhlasu. „Poslechl jsem si na 380 písní Karla Gotta a uvědomil jsem si, jak je mám pod kůží, i když jsem je nikdy cíleně neposlouchal, něco miluji, něco nenávidím," říká Vrzák. Host Lucie Výborné Praha 21:28 18. července 2023

Jak se režíruje umělá inteligence?

Velmi komplikovaně. Režíruje se dominantně pomocí střihu. Umělá inteligence vytvoří padesát verzí jedné věty, které jsou nepoužitelné, a pak někdo sedne a po slovech, slabikách a písmenech tu větu sestříhá tak, aby byla intonovaná, aby dávala smysl.

Emoční stránka je to nejsilnější, čím zatím herci, moderátoři, originální hlasy dokážou umělou inteligenci přebít, říká šéfrežisér Českého rozhlasu

Dva střihači trávili na jednom minutovém odstavci čtyři až šest hodin. Když si vezmeme, že těch minut je tam 160, vyjde nám obrovské množství času.

Když by k vám do studia přišel herec a začal touto intonací číst, prošel by?

Tady jde spíše o nějaký pocit a o využití originálního hlasu. Jsou dvě možnosti, jak umělá inteligence pracuje. Jedna je ta, že mi přečtete větu, naintonujete ji tak, jak si já jako režisér přeji, a potom tu intonaci překlopíme do hlasu.

Zůstane nám intonace, kterou převedeme do jiné hlasové podoby. Což je z hlediska etiky podle mě dost zásadní problém.

My jsme pracovali s metodou, kdy jsme do programu vložili neuvěřitelné množství Karla Gotta, a počítač následně vytvořil větu složenou ze slov, které má. Tím vznikaly různé modely. Nejvíce materiálu bylo z pořadu Zpátky si dám tenhle film.

Karel Gott v něm mluví pozitivním hlasem, s nějakou nostalgií… Jenže my bychom na četbu pamětí potřebovali mít balík „Karel Gott veselý“, balík „Karel Gott neutrální“, balík „Karel Gott smutný“ a mezi tím volit a skládat, abychom dostali tu emoci, která je pro to zásadní.

A myslím si, že ta emoční stránka je to nejsilnější, čím zatím herci, moderátoři, originální hlasy dokážou umělou inteligenci přebít.

Hudba pod kůží

Vy jste kvůli tomu poslouchal hodiny hudby Karla Gotta, na co jste přišel?

Musel jsem si naposlouchat 380 písniček a musím říct, že to bylo docela náročné. Uvědomil jsem si, že tu hudbu znám, přestože jsem ji nikdy cíleně neposlouchal. Ale ten letitý závar hudby v éteru od mého dětství do současnosti, to si člověk ani neuvědomuje, ale má ji nějakým způsobem pod kůží, něco miluje, něco nenávidí.

Ta hudba šedesátých let se mi líbila. Mladí kluci začali psát svoji muziku a k tomu texty a vznikla nějaká původní česká tvorba. Hledáte, odkud to převzali, a zjistíte, že je to česká věc. Čím více se pak posunujeme do 70. a hlavně 80. a 90. let, tím je ta hudba daleko komplikovanější k poslechu.

Ještě bych v rámci umělé inteligence ráda zmínila etiku. Jan Stránský na Seznam Zprávách říká, že ho znervózňuje, že nerozezná originál od softwarové napodobeniny. Je to, co děláme, v pořádku?

Tohle je nesmírně zajímavé téma a já to vnímám velmi osobně. Jsem nepřítelem sociálních sítí. Už to je něco, co rozrušuje moje soukromí, můj svět, moje přátelství. Takže nejsem na sociálních sítích, nezúčastňuji se žádných takových debat, nečtu žádné věci pod články, programově se tomu vyhýbám.

Vnímám to, že etická záležitost syntetického hlasu je velký problém. Projekt, který jsme vytvořili, je vlastně takovým technologickým pokusem o oživení hlasu, který přečte text, jenž Karel Gott sám napsal.

Je ale třeba také vnímat, že tu četbu velmi často doplňuji a ladím symfonickou muzikou, obrovskými záběry smyčců, čímž dodávám emoci a rozptyluji pozornost člověka nad daným hlasem.

Hudba v tu chvíli pracuje s podvědomím a odvádí pozornost od chyb. V zemi, kde může volby rozhodnout jeden ve vhodnou dobu dobře vydaný inzerát v Blesku, mám strach, že práce se syntetickým hlasem může ovlivnit ledacos.

Jaký má vztah k tvorbě Milana Kundery a jak probíhalo natáčení Nesnesitelné lehkosti bytí s Jiřím Bartoškou? Poslechněte si celý rozhovor.