Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

Vědci učí počítače rozumět řeči. Z mumraje slov odhalí třeba i zločin

  17:50
Systémy, které vyvíjejí na Fakultě informačních technologií brněnského VUT, dokážou vyhledávat slova v mluvené řeči. Konkrétní výrazy rychle najdou i v tisících nahrávek. Díky tomu je ocení bezpečnostní složky, pomáhají ale i v call centrech.

S VUT spolupracuje třeba firma Phonexia, která se zabývá hlavně dolováním bezpečnostních informací z řeči. Na snímku uprostřed jsou její zakladatelé Petr Schwarz a Radim Kudla. | foto: Anna Vavríková, MAFRA

Systém umí rozpoznávat slova v mluvené řeči a převádět promluvy do psané podoby. Díky tomu je pak například možné pomocí klíčových slov vyhledávat ve zvukových nebo audiovizuálních záznamech - třeba z přednášek.

„Indexuje se to automaticky systémem pro rozpoznávání řeči, rozhodně to není tak, že by seděl nějaký otrok a přepisoval to,“ žertuje o své práci vedoucí skupiny BUT Speech@FIT při Vysokém učení technickém Jan Černocký.

Výzkumníci z Fakulty informačních technologií se rozpoznáváním řeči zabývají už skoro dvě dekády a celosvětově patří ke špičce v oboru. V závislosti na tématu a kvalitě promluvy jejich systémy dosahují při identifikaci slov vysoké přesnosti - přes 90 procent.

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou jednoduše vyhledávat v audiovizuálních záznamech přednášek.

Spolupracují s firmami, které dolování v řeči již používají ve svých produktech dostupných na trhu. Třeba společnost Phonexia cílí právě na zmíněné získávání bezpečnostních informací z řeči, prodává však i aplikace pro call centra a banky (rozhovor čtěte zde). Firma Lingea se zase soustředí na vyhledávání hlasem ve slovnících.

Schopnosti systému je možné využít například k diktování protokolů či lékařských zpráv, které jsou převedeny do psaného textu.

„Nyní jsme schopni rozpoznávat dobře v prostředí, kde je klid, člověk mluví srozumitelně přímo do mikrofonu. S těžkým prostředím, jakým je třeba zakouřená hlučná hospoda, je ještě potíž. Chceme ale, aby počítače v budoucnu dokázaly přepisovat řeč, detekovat mluvčího a informace z mluvené řeči i ve složitých případech a lépe než člověk,“ nastínil Černocký s tím, že je rád, že výsledky projektu přispěly ke vzniku reálných produktů pro zákazníky.

Člověk má výhodu, zná kontext

Podle něj je rozdíl, jestli má systém rozpoznávat pojmy z debaty o počasí nebo promluvy na mnohem složitější témata. Snadné to není také proto, že při běžné mezilidské komunikaci člověk většinou zná kontext setkání i samotného hovoru.

„Zná preference či politické a náboženské přesvědčení svého protějšku, které do promluvy mohou vstupovat. Má o něm a priori informace. Při porozumění řeči nezáleží jen na řeči samotné, plete se tam reprezentace znalostí celého lidstva. Není to jednoduchý úkol. Když se někdo bude bavit o tuningu rádiem ovládaných aut, tak standardní rozpoznávač vyhoří,“ dodal s tím, že systém učí i adaptaci na méně známé jazyky či dialekty.

Naučit systém nový jazyk jim nyní trvá zhruba půl roku, závisí na jeho obtížnosti a počtu slov. Třeba čeština s půl milionem slov ve spisovné podobě není nic lehkého. Spolupracují při tom s jazykovými odborníky - fonetikem a lingvistou.

V budoucnu by se však dosud neznámé jazyky mohly systémy učit samostatněji.

Projekt podpořila i Technologická agentura

„Pracujeme na algoritmech ‚učení bez učitele‘, aby rozpoznávače byly schopné se samy doučovat a samy trénovat na nové jazyky. Nejraději bychom jen napíchli počítač na internet a řekli systému: Stáhni si vše potřebné a nauč se to sám. Tohle je ale otázka spíš několika dalších desítek let,“ připustil Černocký.

Jednu z etap projektu podpořila skoro 24 miliony korun i Technologická agentura ČR. „Technologie tohoto typu tvoří vysokou přidanou hodnotu díky minimálním nákladům a možnosti vysokých příjmů z prodaných licencí za software,“ objasnil ředitel agentury Petr Očko, proč grant poskytli.

Podle něj jde o velmi důležitý výzkum s potenciálem přinést České republice významné zvýšení podílu hi-tech technologií v ekonomice a uplatnění na mezinárodních trzích.

  • Nejčtenější

Cyklista vjel do křoví a hlavou narazil do stromu. Přilbu měl, přesto zemřel

5. května 2024  12:07,  aktualizováno  13:52

V sobotu v podvečer řešili jihomoravští policisté dvě dopravní nehody. Na Znojemsku naboural řidič...

Dárkyně odkázala babyboxům majetek za miliony, pojmenovali po ní holčičku

9. května 2024  11:29

Garáž v Brně, zhruba milion korun a domek na Blanensku určený k rekonstrukci po sobě jako dar síti...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Hrají si, nebo souloží? Socha psů od Davida Černého část místních pobouřila

10. května 2024  16:19

Vinařství Dog in Dock má ve svém areálu ve Veselí nad Moravou na Hodonínsku novou sochu psů od...

V Brně začala výstavba prémiových bytů, jeden vyjde v průměru na 16 milionů

3. května 2024  17:56

Jako o prázdninách, které trvají 365 dnů v roce, si mají v budoucnu připadat rezidenti žijící v...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Místo přání dostala prodavačka ránu kladivem, další zastřelil falešný prodejce

5. května 2024

Premium Takřka dokonaný mord mladičké prodavačky v brněnském obchodě s moukou se v roce 1909 odehrál na...

Hrají si, nebo souloží? Socha psů od Davida Černého část místních pobouřila

10. května 2024  16:19

Vinařství Dog in Dock má ve svém areálu ve Veselí nad Moravou na Hodonínsku novou sochu psů od...

Letovice koupily areál zkrachovalého Tylexu, samy si vyberou nové zájemce

10. května 2024  15:40

Po krachu proslulé letovické textilky Tylex koncem minulého roku vlastní její rozsáhlý areál přímo...

Po útoku prudkým jedem stromy znovu obrazily, vandala ale policie nedopadla

10. května 2024  13:54

Vyvrtané díry do kmenů stromů a uvnitř stopy po glyfosátu neboli prudkém jedu na hubení plevele,...

Na šampionát opět do Prahy a Ostravy. Brno slibovanou arénu nestihlo včas

10. května 2024  11:13

Zatímco v Praze a Ostravě dnes budou při zahájení hokejového mistrovství světa házet na led puk, v...

Jak předejít syndromu náhlého úmrtí kojence?
Jak předejít syndromu náhlého úmrtí kojence?

Syndrom náhlého úmrtí kojence (SIDS – sudden infant death syndrome) je doslova noční můrou všech rodičů. V současné době lze tomuto zbytečnému...

V 59 letech zemřela herečka Simona Postlerová, ještě v sobotu zkoušela

Zemřela divadelní a filmová herečka Simona Postlerová, bylo jí 59 let. Zprávu o úmrtí potvrdil nadační fond Dvojka...

Titěrné sukně i míčky na podpatcích. Zendaya vzkřísila trend tenniscore

S nadsázkou bychom mohli říct, že největší tenisovou událostí tohoto roku je premiéra snímku Rivalové. Aspoň co se módy...

Zpěvačka Tereza Kerndlová měla autonehodu. Poslala vzkaz ze záchranky

Tereza Kerndlová (37) a její manžel René Mayer (53) měli v úterý ráno autonehodu. Na mokré vozovce do nich zezadu...

Kamion před nehodou vůbec nebrzdil, moderní tahač by tragédii zabránil

Policie obvinila řidiče za smrtelnou nehodu na D1. Litevský kamioňák narazil do osobního auta a natlačil ho na tahač s...

První světová válka zničila část Francie natolik, že tu stále řádí smrt

Řídkým rozvolněným lesem pokrytá pahorkatina u francouzského Soissons, Compiégne, Lens či Cambrai přirozeně svádí k...