Program zahrnuje nové hlasové moduly, automatickou adaptaci na řečníka, ve srovnání s předchozími verzemi obsahuje výkonnější rozpoznávací jádro a rozsáhlejší slovníky, které lze snadno modifikovat. „Uživatel si může sám do slovníku i výrazy přidávat podle frekvence užívání, může si vytvořit vlastní šablony a formuláře. Systém také eliminuje rušivé zvuky z okolí, automaticky doplňuje čárky před spojkami, formátuje číselné výrazy apod, “ přiblížil novou verzi profesor Jan Nouza, který už před 18 lety na Fakultě mechatroniky, informatiky a mezioborových studií TUL vytvořil první český program na hlasové ovládání.
Na výzkumu zdokonalování programu, zavádění do praxe a dalších aplikacích spolupracuje jeho tým s firmou Newton Technologies řadu let. Mimo jiné před několika lety uvedl na trh program MyVoice, který umožňuje lidem s nepohyblivýma rukama ovládat hlasem nejen počítač, ale i další elektronická zařízení. Ovládání hlasem nabízejí přímo i někteří výrobci elektroniky, například Samsung u některých modelů televizí, ale ne pro češtinu.
Hlavní výhodou programu MyVoice je především to, že uživatel si může povely libovolně zvolit, např. tak, aby se mu dobře vyslovovaly. Další výhoda programu MyVoice spočívá v tom, že se dá jednoduše propojit s prvky takzvané domácí automatice (dálkově ovládanými zásuvkami, spínači, dveřními zámky, ovladači, apod.), čímž se dá vytvořit byt vhodný pro osoby s různými zdravotními problémy a postiženími. V oblasti přepisu češtiny se nová verze programu NewtonDictate svou přesností již blíží hranici, která může konkurovat profesionálním písařkám. Například u právnických textů lze po krátkém zaučení dosáhnout úspěšnost nad 97 %. To bylo vidět i při vlastní prezentaci, kdy byly různými lidmi diktovány náhodně vybrané články z aktuálního vydání denního tisku. Profesor Nouza také předvedl, že programy vyvinuté na TUL zvládají přepis i dalších slovanských jazyků – polštiny, chorvatštiny a dokonce i ruštiny v azbuce.
Hlavní výhodou programu MyVoice je především to, že uživatel si může povely libovolně zvolit, např. tak, aby se mu dobře vyslovovaly. Další výhoda programu MyVoice spočívá v tom, že se dá jednoduše propojit s prvky takzvané domácí automatice (dálkově ovládanými zásuvkami, spínači, dveřními zámky, ovladači, apod.), čímž se dá vytvořit byt vhodný pro osoby s různými zdravotními problémy a postiženími. V oblasti přepisu češtiny se nová verze programu NewtonDictate svou přesností již blíží hranici, která může konkurovat profesionálním písařkám. Například u právnických textů lze po krátkém zaučení dosáhnout úspěšnost nad 97 %. To bylo vidět i při vlastní prezentaci, kdy byly různými lidmi diktovány náhodně vybrané články z aktuálního vydání denního tisku. Profesor Nouza také předvedl, že programy vyvinuté na TUL zvládají přepis i dalších slovanských jazyků – polštiny, chorvatštiny a dokonce i ruštiny v azbuce.
Firmy již hledají své hlasy
Speciální aplikací hlasových technologií vyvinutých ve spolupráci TUL a Newtonu je program sloužící pro kontrolu kvality výroby, kdy zaměstnanec identifikuje výrobek prostřednictvím čárového kódu a hlasem označí stav výrobku. Výsledky se ukládají do podnikové databáze a údaje pak slouží jako podklad pro podnikový informační systém. První nasazení se připravuje v jednom velkém libereckém výrobním podniku.
Na trh chce firma podle Heriana uvést tři aplikace programu Dictate 3 a sice od základní verze pro diktování textu až po profesionální sestavu, v níž je i speciální mikrofon a zařízení pro usnadnění přehrávání. Cena se bude pohybovat od 5 000 do 35 000 korun. „Diktovat lze do osobních počítačů, tabletů nebo mobilních telefonů. Systém rozpoznává různé řečníky, poradí si i s méně spisovnou mluvou a do značné míry eliminuje rušivé zvuky,“ konstatoval profesor Nouza.
Tým profesora Jana Nouzy se na Technické univerzitě v Liberci počítačovým rozpoznáváním řeči zabývá dlouhodobě. V roce 1994 vyvinul první český hlasem ovládaný program a v roce 2006 dokončil technologii pro plynulé diktování do počítače. V současné době má výzkumný tým profesora Nouzy 15 odborných pracovníků. Je zapojen v národních i evropských programech výzkumu (GAČR, TAČR, NAKI, COST). Jedním z největších projektů, na kterém liberečtí vědci pracují, je kompletní přepis a zpřístupnění zvukového archivu Českého rozhlasu.
Zdroj: T-UNI