Jste zde

Počítačové zpracování řeči rozpozná nadšení a ironii, přepíše i prvorepublikové záznamy

Čtyřletý projekt Ministerstva kultury, jehož cílem je zpřístupnit historický archiv Českého rozhlasu tak, aby se v něm daly hledat informace uložené v desetitisících audionahrávek, řeší tým profesora Jana Nouzy v Laboratoři počítačového zpracování řeči FM TUL.

Jedná se o největší český archiv mluveného slova, který je již považován za součást národního dědictví. Zatím lze v archivu hledat jen podle stručného popisu nahrávek, hledat přímo v záznamech dosud žádný systém neumí. „Vytváříme programy, které archivní záznamy přepisují a převádějí řeč do textové podoby. Zároveň ukládají přepsané texty do databáze v níž se pak dá hledat nejen podle slov, ale i podle dalších kritérií - například ve vybraném  časovém období, v určitém typu pořadu a dokonce i podle hlasu konkrétní osoby,“ přibližuje projekt profesor Nouza.

Systém během krátké chvíle najde hledané slovo v celém archivu a umožní přehrát si právě tu část nalezeného pořadu, kde se slovo nachází. „Ve vytvářené databázi je totiž u každého slova časová značka, která s přesností na desítky milisekund identifikuje místo výskytu slova v nahrávce. Redaktor nebo posluchač si podle klíčového slova najde a vzápětí poslechne tu část pořadu, která ho zajímá,“ dodává Nouza.

Archiv pokrývá devadesát let vysílání a v rámci projektu bude přepsáno několik desítek tisíc hodin audiozáznamů. Kromě hlavního cíle, kterým je umožnit rychlé vyhledávání požadované informace, bude systém poskytovat velmi zajímavý obrázek vývoje mluvené češtiny. Při  řešení projektu se technici spojili s  lingvisty z katedry českého jazyka a literatury Fakulty přírodovědně humanitní a pedagogické TUL. Ti jim pomáhají při tvorbě  vzorových přepisů, na kterých se systém naučí a současně řeší lingvistické otázky. „Při zpracování archivu jdeme vlastně proti toku času. Zvládáme již přepis soudobě řeči, ale postupně budeme muset systém přeučovat na jazyk a slovník předchozích období, včetně komunistické éry, válečné i prvorepublikové epochy“, podotkl Nouza.
 
 
foto: T-UNI
 

„postupně budeme muset systém přeučovat na jazyk a slovník předchozích období,
včetně komunistické éry, válečné i prvorepublikové epochy“
 

Laboratoř počítačového zpracování řeči, kterou profesor Jan Nouza na FM TUL založil v roce 1993, patří k nejúspěšnějším laboratořím v oboru hlasových technologií v České republice. Vyvinula například softwarové programy pro ovládání počítače hlasem MyVoice a MyDictate, které umožňují práci s počítačem i lidem s nefunkčníma rukama. Činnosti, které se vykonávají pomocí  tradičních vstupních zařízení, jsou nahrazeny hlasovými povely snímanými mikrofonem. Umožňují hlasem a bez použití rukou spouštět libovolný program, psát textové dokumenty, přijímat i odesílat elektronickou poštu, využívat internet, kreslit obrázky, pouštět si hudbu, ovládat televizní i rozhlasové programy, telefonovat a v neposlední řadě též diktovat texty.

Velkým úspěchem je i program Newton Dictate, vyvinutý a distribuovaný ve spolupráci s firmou Newton Technologies. Program usnadňuje práci zejména lékařům a právníkům. Zprávy či rozsudky totiž mohou diktovat přímo do počítače, či nahrávat do diktafonu, a program jim řeč převede do textu. S ním lze nakládat nejen obvyklým způsobem, tj. editovat ho či modifikovat, ale také přehrávat jeho libovolné části.

„Řeč je informačně velmi bohatý zdroj. Kromě vlastního obsahu se z ní dá vyčíst řada dalších informací, např. kdo mluví a jakou řečí, v jaké je fyzické či duševní kondici, jak je právě emočně naladěn, atd. I na tyto informace se v našem výzkumu postupně zaměřujeme. Pokud bude řečník uveden v databázi, objeví se v přepisech i jeho jméno. Navíc tam přibude informace o emočním stylu řeči, to znamená, že vyčteme, zda je řečník rozzlobený, nadšený, smutný, nebo zda se jedná o ironii“ upřesnil Nouza.
 

Zdroj: T-UNI

Hodnocení článku: