Jste zde

TUL významně posouvá hlasové technologie

Novou verzi programu NEWTON Dictate 3, která vychází z nejnovějších poznatků v oblasti rozpoznávání řeči, v Praze nedávno představily tuzemská firma Newton Technologies a Technická univerzita v Liberci. Jedná se o aplikaci hlasové technologie, která dokáže do počítače přepsat téměř bezchybně slovní projev a kromě elektroniky dokáže hlasovými povely ovládat třeba i domácí spotřebiče.
Program zahrnuje nové hlasové moduly, automatickou adaptaci na řečníka, ve srovnání s předchozími verzemi obsahuje výkonnější rozpoznávací jádro a rozsáhlejší slovníky, které lze snadno modifikovat. „Uživatel si může sám do slovníku i výrazy přidávat podle frekvence užívání, může si vytvořit vlastní šablony a formuláře. Systém také eliminuje rušivé zvuky z okolí, automaticky doplňuje čárky před spojkami, formátuje číselné výrazy apod, “ přiblížil novou verzi profesor Jan Nouza, který už před 18 lety na Fakultě mechatroniky, informatiky a mezioborových studií TUL vytvořil první český program na hlasové ovládání.
 
 
Na výzkumu zdokonalování programu, zavádění do praxe a dalších aplikacích spolupracuje jeho tým s firmou Newton Technologies řadu let. Mimo jiné před několika lety uvedl na trh program MyVoice, který umožňuje lidem s nepohyblivýma rukama ovládat hlasem nejen počítač, ale i další elektronická zařízení. Ovládání hlasem nabízejí přímo i někteří výrobci elektroniky, například Samsung u některých modelů televizí, ale ne pro češtinu.

Hlavní výhodou programu MyVoice je především to, že uživatel si může povely libovolně zvolit, např. tak, aby se mu dobře vyslovovaly. Další výhoda programu MyVoice spočívá v tom, že se dá jednoduše propojit s prvky takzvané domácí automatice (dálkově ovládanými zásuvkami, spínači, dveřními zámky, ovladači, apod.), čímž se dá vytvořit byt vhodný pro osoby s různými zdravotními problémy a postiženími.  V oblasti přepisu češtiny se nová verze programu NewtonDictate svou přesností již blíží hranici, která může konkurovat profesionálním písařkám. Například u právnických textů lze po krátkém zaučení dosáhnout úspěšnost nad 97 %. To bylo vidět i při vlastní prezentaci, kdy byly různými lidmi diktovány náhodně vybrané články z aktuálního vydání denního tisku. Profesor Nouza také předvedl, že programy vyvinuté na TUL zvládají přepis i dalších slovanských jazyků – polštiny, chorvatštiny a dokonce i ruštiny v azbuce.
 

Firmy již hledají své hlasy

Speciální aplikací hlasových technologií vyvinutých ve spolupráci TUL a Newtonu je program sloužící pro kontrolu kvality výroby, kdy zaměstnanec identifikuje výrobek prostřednictvím čárového kódu a hlasem označí stav výrobku. Výsledky se ukládají do podnikové databáze a údaje pak slouží jako podklad pro podnikový informační systém. První nasazení se připravuje v jednom velkém libereckém výrobním podniku.
Oba partneři zároveň ukázali, že po dalším zdokonalení umožňuje program My Voice ovládat hlasem prakticky jakýkoliv spotřebič s dálkovým ovládáním.  „Funkce dálkového ovladače se jednou nahrají do počítače a každému tlačítku se přiřadí jeden hlasový příkaz, který danou funkci spustí. Systém může kromě televizí nebo hi-fi věží ovládat i další zařízení prostřednictvím spínačů nebo zásuvek ovládaných na dálku. Schopnější informatik si pomocí našeho programu dokáže zařízení ovládající TV, lampičku nebo věž sestavit sám,“ uvedl ředitel společnosti Petr Herian.

Na trh chce firma podle Heriana uvést tři aplikace programu Dictate 3 a sice od základní verze pro diktování textu až po profesionální sestavu, v níž je i speciální mikrofon a zařízení pro usnadnění přehrávání. Cena se bude pohybovat od 5 000 do 35 000 korun. „Diktovat lze do osobních počítačů, tabletů nebo mobilních telefonů. Systém rozpoznává různé řečníky, poradí si i s méně spisovnou mluvou a do značné míry eliminuje rušivé zvuky,“ konstatoval profesor Nouza.

Tým profesora Jana Nouzy se na Technické univerzitě v Liberci počítačovým rozpoznáváním řeči zabývá dlouhodobě. V roce 1994 vyvinul první český hlasem ovládaný program a v roce 2006 dokončil technologii pro plynulé diktování do počítače. V současné době má výzkumný tým profesora Nouzy 15 odborných pracovníků.  Je zapojen v národních i evropských programech výzkumu (GAČR, TAČR, NAKI, COST). Jedním z největších projektů, na kterém liberečtí vědci pracují, je kompletní přepis a zpřístupnění zvukového archivu Českého rozhlasu.
 
Zdroj: T-UNI
Hodnocení článku: