Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

Vědci učí počítače rozumět řeči. Z mumraje slov odhalí třeba i zločin

  17:50
Systémy, které vyvíjejí na Fakultě informačních technologií brněnského VUT, dokážou vyhledávat slova v mluvené řeči. Konkrétní výrazy rychle najdou i v tisících nahrávek. Díky tomu je ocení bezpečnostní složky, pomáhají ale i v call centrech.

S VUT spolupracuje třeba firma Phonexia, která se zabývá hlavně dolováním bezpečnostních informací z řeči. Na snímku uprostřed jsou její zakladatelé Petr Schwarz a Radim Kudla. | foto: Anna Vavríková, MAFRA

Systém umí rozpoznávat slova v mluvené řeči a převádět promluvy do psané podoby. Díky tomu je pak například možné pomocí klíčových slov vyhledávat ve zvukových nebo audiovizuálních záznamech - třeba z přednášek.

„Indexuje se to automaticky systémem pro rozpoznávání řeči, rozhodně to není tak, že by seděl nějaký otrok a přepisoval to,“ žertuje o své práci vedoucí skupiny BUT Speech@FIT při Vysokém učení technickém Jan Černocký.

Výzkumníci z Fakulty informačních technologií se rozpoznáváním řeči zabývají už skoro dvě dekády a celosvětově patří ke špičce v oboru. V závislosti na tématu a kvalitě promluvy jejich systémy dosahují při identifikaci slov vysoké přesnosti - přes 90 procent.

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou jednoduše vyhledávat v audiovizuálních záznamech přednášek.

Spolupracují s firmami, které dolování v řeči již používají ve svých produktech dostupných na trhu. Třeba společnost Phonexia cílí právě na zmíněné získávání bezpečnostních informací z řeči, prodává však i aplikace pro call centra a banky (rozhovor čtěte zde). Firma Lingea se zase soustředí na vyhledávání hlasem ve slovnících.

Schopnosti systému je možné využít například k diktování protokolů či lékařských zpráv, které jsou převedeny do psaného textu.

„Nyní jsme schopni rozpoznávat dobře v prostředí, kde je klid, člověk mluví srozumitelně přímo do mikrofonu. S těžkým prostředím, jakým je třeba zakouřená hlučná hospoda, je ještě potíž. Chceme ale, aby počítače v budoucnu dokázaly přepisovat řeč, detekovat mluvčího a informace z mluvené řeči i ve složitých případech a lépe než člověk,“ nastínil Černocký s tím, že je rád, že výsledky projektu přispěly ke vzniku reálných produktů pro zákazníky.

Člověk má výhodu, zná kontext

Podle něj je rozdíl, jestli má systém rozpoznávat pojmy z debaty o počasí nebo promluvy na mnohem složitější témata. Snadné to není také proto, že při běžné mezilidské komunikaci člověk většinou zná kontext setkání i samotného hovoru.

„Zná preference či politické a náboženské přesvědčení svého protějšku, které do promluvy mohou vstupovat. Má o něm a priori informace. Při porozumění řeči nezáleží jen na řeči samotné, plete se tam reprezentace znalostí celého lidstva. Není to jednoduchý úkol. Když se někdo bude bavit o tuningu rádiem ovládaných aut, tak standardní rozpoznávač vyhoří,“ dodal s tím, že systém učí i adaptaci na méně známé jazyky či dialekty.

Naučit systém nový jazyk jim nyní trvá zhruba půl roku, závisí na jeho obtížnosti a počtu slov. Třeba čeština s půl milionem slov ve spisovné podobě není nic lehkého. Spolupracují při tom s jazykovými odborníky - fonetikem a lingvistou.

V budoucnu by se však dosud neznámé jazyky mohly systémy učit samostatněji.

Projekt podpořila i Technologická agentura

„Pracujeme na algoritmech ‚učení bez učitele‘, aby rozpoznávače byly schopné se samy doučovat a samy trénovat na nové jazyky. Nejraději bychom jen napíchli počítač na internet a řekli systému: Stáhni si vše potřebné a nauč se to sám. Tohle je ale otázka spíš několika dalších desítek let,“ připustil Černocký.

Jednu z etap projektu podpořila skoro 24 miliony korun i Technologická agentura ČR. „Technologie tohoto typu tvoří vysokou přidanou hodnotu díky minimálním nákladům a možnosti vysokých příjmů z prodaných licencí za software,“ objasnil ředitel agentury Petr Očko, proč grant poskytli.

Podle něj jde o velmi důležitý výzkum s potenciálem přinést České republice významné zvýšení podílu hi-tech technologií v ekonomice a uplatnění na mezinárodních trzích.

  • Nejčtenější

Vrátili se problémoví Romové, zmínila starostka. Komunita chce její rezignaci

26. dubna 2024  16:13

Vlnu nevole a odsouzení rozpoutala svými výroky na adresu Romů poslankyně a starostka brněnských...

Novým majitelem Zbrojovky Brno se stal hokejový boss Libor Zábranský

25. dubna 2024  11:25,  aktualizováno  13:52

Majitelem fotbalové Zbrojovky Brno se stal Libor Zábranský, šéf hokejové Komety. V tiskovém...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

V Břeclavi na chlapce spadla branka, na následky zranění zemřel

1. května 2024

V Břeclavi ve středu v podvečer po úrazu na hřišti zemřel dvanáctiletý chlapec. Policie okolnosti...

Rivalové z finále v jedné šatně: Do neděle bychom se zabili, hlásil Sedlák

1. května 2024  15:24

Ještě v neděli by si během finále extraligy nejraději vyškrábali oči, do prodloužení sedmého zápasu...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Problém Drnovic si uvědomujeme. Americký šéf o budoucnosti Vyškova

26. dubna 2024

Premium Ještě před půl rokem o americké společnosti Blue Crow Sports Group nevěděli ani fanoušci...

Na prevenci Češi nehledí, nemoci srdce a cév přitom mají tři miliony z nich

2. května 2024  16:02

Na nemoci srdce a cév zemře v Česku víc lidí než na všechny nádory dohromady. Pacientů s...

Chtěl ho Baník, říkají místní o chlapci, jehož zabila branka. Stav hřiště je štve

2. května 2024  15:02

Premium Z tragédie se vzpamatovávají lidé z břeclavského sídliště Na Valtické. Ve středu večer tam spadla...

Já a no name? Je mně to fuk. Dostál o urážce z Toronta i klipu s Offspring

2. května 2024  10:45

Nejlepší nováček měsíce, málem autor gólu, pro list Toronto Sun po zápase s Javorovými listy „no...

Dvacet let dotací z EU. Přinesly zločiny, ale i vlaky, techniku a splavné řeky

2. května 2024

Premium Lázně, které nevznikly a je z nich night club nebo zdvihací most, který se nikdy nezdvihl. Česko...

10 nejčastějších podvodů na internetu: Dokážete ochránit sebe i svou rodinu?
10 nejčastějších podvodů na internetu: Dokážete ochránit sebe i svou rodinu?

V digitální éře, kde technologie proniká do všech aspektů našich životů, se také zvyšuje riziko podvodů. Od falešných e-mailů a inzerátů až po...

Natáčení Přátel bylo otřesné, vzpomíná herečka Olivia Williamsová

Britská herečka Olivia Williamsová (53) si ve čtvrté sérii sitcomu Přátelé zahrála epizodní roli jedné z družiček na...

Byli vedle ní samí ztroskotanci, vzpomíná Basiková na muže Bartošové

Byly každá z jiného těsta, ale hlavně se pohybovaly na opačných pólech hudebního spektra. Iveta Bartošová byla...

Autofotka: Sen z plakátů v kotrmelcích. Mladíček v tunelu rozbil Ferrari F40

Symbol italské nenažranosti se již skoro čtyři dekády pokouší zabít své řidiče. Jízda s Ferrari F40 bez posilovače...

Ukaž kozy, řvali na ni. Potřebovala jsem se obouchat, vzpomíná komička Macháčková

Rozstřel Pravidelně vystupuje v pořadu Comedy Club se svými stand-upy, za knihu Svatební historky aneb jak jsem se nevdala se...

Do Bolívie jsem odešla kvůli smrti rodičů, přiznala sestra Romana Vojtka

Mladší sestra herce Romana Vojtka (52) Edita Vojtková (49) je módní návrhářkou a žije v Bolívii. Do zahraničí odešla...