Právo v pátek testovalo přímo u dodavatele program, který má umožnit přepis lidského hlasu do psané formy. A to možná už za půl roku. Test dopadl podle očekávání. Protokolaci právnického textu zvládá program téměř bezchybně.

Ovšem například přepis policejního odposlechu, v němž se fotbalový bafuňář s rozhodčím velmi lidovou češtinou domlouvají, jak má být za úplatek ovlivněn příští zápas, počítač zatím nezvládne. Výpověď člena Berdychova gangu, kterou předtím upravil redaktor Práva do spisovného jazyka, dopadla tak půl na půl.

„Tak jsem prostě šlápl na zmizík,“ popsal v nedávném rozhovoru pro Právo berdychovec Tomáš Půta, jak se vyhnul vězení. Když jsme text nadiktovali do mikrofonu záznamového zařízení, na obrazovce počítače se objevilo: „Tak jsem prostě šla voda zmizí v.“

I tak by mohlo být používání přepisového zařízení užitečným pomocníkem soudců, ovšem zatím jen při spisovné a pečlivě čtené protokolaci. „Když program rozpozná text s 85procentní úspěšností nebo vyšší, už se vyplatí, i přesto, že musíte provést korekturu,“ hodnotí efektivitu elektronického přepisu řeči Petr Herian ze společnosti Newton Technologies, která na vývoji programu dlouhodobě spolupracuje s Technickou univerzitou v Liberci. Při nižší úspěšnosti je však přece jen lepší živá zapisovatelka. Úpravy v textu totiž zaberou víc času než samotný ruční přepis.

Zná 370 tisíc slov


Při vývoji „elektronické zapisovatelky“ v Newtonu čerpali z rozsáhlé databáze skoro 400 tisíc slov a slovních tvarů, kterou firma nashromáždila víc než 15letým monitoringem českých tištěných i audiovizuálních médií.

Kromě novinářsko-překladatelské databáze postupně vytvořila i lékařský a justiční slovník. Vzhledem k širokému rejstříku toho, co běžně zaznívá v soudních síních – například při výpovědích svědků – je však právě justiční slovník největším oříškem.
Například na záznam policejního odposlechu manažera fotbalové Viktorie Žižkov Ivana Horníka s rozhodčím Milanem Šedivým byl program i s 370 tisíci slovními obraty krátký.

Například slovo „vole“ justiční program ale přepisuje vesměs správně. Prý si jeho zařazení do slovníku přáli už při prvním kole testování sami soudci.
Při zápisu však přístroj bere do úvahy kromě slovní zásoby i slovosled, který rozlišuje podle šesti po sobě následujících slov.

Důležitá je také intonace a artikulace. „V databázi systémů jsou nastaveny stovky typů hlasu. Hlas každého uživatele se přiřadí k nejbližšímu podobnému typu. Pokud nemáte výraznou vadu řeči nebo výjimečnou charakteristiku hlasu, můžete hned začít diktovat,“ vysvětluje Herian s tím, že program si umí i „zvyknout“ na hlas konkrétního uživatele.

Ministerstvo stále testuje


Ministerstvo spravedlnosti zahájilo druhé kolo testování přepisového zařízení pro soudní protokolaci začátkem ledna. Méně vyspělé programy se na soudech testovaly už loni, ale s nevelkým úspěchem. „Občas z toho lezly strašné nesmysly,“ konstatoval například místopředseda Městského soudu v Praze.

Teď firma distribuuje na soudy bezplatně přes tisícovku licencí k testování vylepšené verze. Podle Jitky Zinke z tiskového oddělení ministerstva projevila o program zájem většina krajských soudů a některá státní zastupitelství. Testování má skončit v pololetí, pokud však soudy nebudou spokojeny, může se pilotní projekt protáhnout do konce roku. Bude-li se skutečně nakupovat, cenu za jedno zařízení včetně instalace, údržby a školení obsluhy vyčíslilo ministerstvo na 28 tisíc korun.