Súdne rozhodnutia musia byť prístupné verejnosti, no zároveň nesmú prezrádzať osobné údaje. Riešenie, na ktorom spolupracuje Venal Data s Ministerstvom spravodlivosti, kombinuje umelú inteligenciu a ľudskú kontrolu, aby anonymizácia bola rýchla a konzistentná. Výsledkom je bezpečnejšie zverejňovanie a lepšia práca s dokumentmi vrátane vyťaženia odkazov na právne predpisy.
Technológia: spojenie AI a ľudí
Systém rozpoznáva viac ako 30 typov entít pomocou hybridnej metódy pomenovaných entít a NLP prispôsobeného slovenčine. Základ vznikol ručnou anotáciou približne 500–1000 dokumentov, na ktorých sa natrénoval prvý model a ten sa ďalej priebežne zlepšuje. Anonymizácia je poloautomatická: AI spraví väčšinu práce a človek ju overuje, pričom zásah je potrebný len asi v 40 % dokumentov. Hoci presnosť ešte nedosahuje človeka, AI je konzistentná aj na dlhých textoch, čím pomáha zjednocovať prax, čo sa považuje za osobný údaj.
Výsledky v praxi a čo príde ďalej
Priemerný čas anonymizácie klesol zo desiatok minút na približne päť minút na jedno rozhodnutie. Pomáha aj používateľské rozhranie postavené na jednotnom dizajn manuáli a Reacte: ponúka napríklad funkcie späť/ďalej (Ctrl+Z), priebežné ukladanie a odolnosť voči výpadkom pripojenia. Vďaka prehľadnej navigácii a prezentácii označených údajov sa zvyšuje kvalita výstupov a klesá riziko úniku informácií.
Systém už spracoval desiatky tisíc rozhodnutí a postupne sa zapájajú takmer všetky súdy vrátane nových správnych súdov. Do budúcna sa zvažuje využitie transformerov a veľkých jazykových modelov na presnejšie rozpoznávanie entít a anonymizáciu. Ďalším krokom môže byť inteligentný editor na tvorbu rozhodnutí a odporúčanie podobnej judikatúry, aby práca sudcovských a justičných pracovníkov bola efektívnejšia.