Živý prepis reči a okamžitý preklad sa z technologického sľubu stali každodenným nástrojom. Od konferenčných sál cez televízne štúdiá až po súdy pomáha softvér prevádzať hovorené slovo na čitateľný text v priebehu sekúnd. Vývojári pritom kombinujú pohodlie webovej aplikácie s možnosťou bezpečného nasadenia priamo u klienta.
Od prvých pokusov k živému prepisu
Prvé riešenia rozpoznávania reči v tomto tíme sa objavili okolo roku 2000, a v roku 2005 vznikol pre češtinu a slovenčinu systém Newton Dictate od spoločnosti Newton Technologies. Impulzom bola potreba masívnych prepisov pre mediálny monitoring (na Slovensku ho zastrešovala spoločnosť Slovakia Online), preto projekt vznikal v spolupráci s univerzitou v Liberci. Výsledkom bol základ, na ktorom sa dalo ďalej stavať.
Dnešná verzia zvláda prepis hovoreného slova v reálnom čase a dokáže rozpoznať konce viet, zmeny hovoriaceho aj priamu reč. Pri angličtine uvádzajú úspešnosť okolo 97 %; pri kórejčine počas ukážky s nadsádzkou hovorili o „110 %“, čím zdôraznili vysokú kvalitu. Systém vie nielen prepisovať, ale aj prekladať medzi jazykmi.
Konferencie, televízia a titulky do štyroch sekúnd
Technológia sa osvedčila na desiatkach konferencií a dnes beží aj pri živom titulkovaní televízneho vysielania 24/7. V praxi to znamená, že do štyroch sekúnd musí vzniknúť nielen presný prepis, ale aj správne rozdelené titulky, ktoré sú čitateľné aj pre nepočujúcich. V jednej z televízií (CNN Prima News) sa ukázalo, že live titulkovanie je rýchlejšie a presnejšie než samotný surový prepis.
Keďže ide o webovú aplikáciu, obsluha môže označovať hovoriacich a systém sa naučí ich hlasy rozpoznávať v ďalšom vysielaní. Prehľadnosť zvyšuje aj farebné odlíšenie podľa osoby, takže divák či editor rýchlo vidí, kto práve hovorí. Takéto funkcie znižujú záťaž pre editorov a zrýchľujú publikovanie výstupov.
Bezpečnosť, nasadenia a nástroje pre redakcie
Okrem cloudu je k dispozícii aj on‑premise riešenie pre inštitúcie, ktoré potrebujú mať dáta pod úplnou kontrolou. V Česku ho využíva ministerstvo spravodlivosti na nahrávanie a prepis súdnych pojednávaní, rovnako polícia; jednu bezpečnostnú zložku na Slovensku hovorca nemenoval. Technológiu možno nasadiť aj na izolovaný notebook – prvým klientom bola Česká národná banka pre utajované rokovania bankovej rady – a v parlamente pomáha stenografom plánovať schôdze vďaka integrovanému nahrávaniu a časovaču.
Systém dokáže prepisovať, prekladať, titulkovať, sumarizovať a hľadať kľúčové slová v streamoch, pričom všetko zostáva pod kontrolou človeka. Opravy operátorov slúžia ako cenné dáta na ďalšie zlepšovanie modelov, preto je technológia z roka na rok presnejšia. Medzi veľkých klientov patrí rakúska tlačová agentúra APA, ktorá prepisuje v nemčine rozhlasové a televízne vysielanie; aplikácia zároveň ukladá nahrávky aj prepisy, umožňuje fulltextové vyhľadávanie a jedným klikom zdieľať text do redakcie na citácie či rýchle súhrny.