Hlavní obsah

Technologie z Brna bezpečně pozná hlas teroristy v davu

Právo, Miroslav Homola

Z akčních filmů to zná každý. Směrové mikrofony, odposlouchávání padouchů na dálku, identifikace pozměněných hlasů vyděračů. Takové a další postupy jsou i v reálném světě terorismu a násilí pro některé specialisty běžnou pracovní náplní. Ke světové špičce, která vyvíjí technologii pro analýzu řeči a hlasovou biometrii, patří brněnská společnost Phonexia.

Foto: Miroslav Homola, Právo

Technologie dokáže odhalit řečníka i jeho pohlaví a věk.

Článek

Svou technologií Deep Embeddings jako první na světě pro identifikaci mluvčího využívá výhradně hluboké neuronové sítě umělé inteligence, která se stále více snaží o stejné výkony, které dokáže i lidský mozek.

„Naše technologie analyzují hlas z nahrávky či telefonického rozhovoru a na základě toho umožňují identifikovat řečníka, jeho pohlaví nebo přibližný věk. Dokážou i z několika hlasů najednou vytáhnout hlas konkrétní osoby, monitorovat výskyt konkrétních frází v řeči a mluvené slovo přepsat do psané podoby,“ uvádí Michal Hrabí, výkonný ředitel společnosti.

„Využití nachází jak v komerční sféře, tak při identifikaci pachatelů trestných činů nebo odhalování teroristických hrozeb. V komerčním sektoru se naše technologie mohou uplatnit například u služeb hlasových asistentů, při hlasové autorizaci úkonů v bankách či pojišťovnách nebo v call centrech,” říká Michal Hrabí.

I hlasový otisk obsahuje nezaměnitelnou biometrickou informaci

Technologie obstojí i v extrémně hlučném prostředí. Dokázal to pokus, na kterém se podíleli i vědci z brněnského Vysokého učení technického a z USA. I když nebyl přes hluk hlas takřka slyšet, podařilo se rozeznat jazyk a pohlaví mluvčích, identifikovat je.

Novou technologii Deep Embeddings představila Phonexia letos na jaře. Pro identifikaci a ověření mluvčího hluboké neuronové sítě analyzují krátké úseky hovoru a samy se učí rozpoznávat unikátní prvky hlasu každé osoby.

Stejně jako třeba otisk prstu nebo scan oční rohovky i hlasový otisk obsahuje nezaměnitelnou biometrickou informaci, kterou dokážou neuronové sítě rozpoznat a přiřadit ji pak ke konkrétnímu mluvčímu.

Nejnovější technologie je dvakrát rychlejší a 2,4krát přesnější než předchozí verze. „Vyšší přesnost a rychlost šetří čas i peníze – ať už jde o snížení pravděpodobnosti, že bude klient omylem odmítnut při hlasovém ověření, nebo o zvýšení šance odhalení podvodníka, který si chce pod identitou někoho jiného třeba vzít bankovní půjčku,“ doplnil technický šéf firmy Petr Schwarz.

Phonexia vznikla v roce 2006, kdy ji založil tým vědců brněnské Fakulty informačních technologií VUT, který se rozpoznáváním řeči zabýval v rámci univerzitního výzkumu. Obrat společnosti v roce 2017 oproti předchozímu období vzrostl o 90 procent, čtyři pětiny z toho má „na svědomí“ zahraničí.

Reklama

Související témata:

Související články

Výběr článků

Načítám