Diagnostika Alzheimerovej choroby z reči už nie je sci-fi: výskumníci zo SAV spájajú rozpoznávanie a syntézu reči, umelú inteligenciu a sociálnu robotiku. Vďaka aplikáciám a robotom možno neinvazívne odhaliť miernu kognitívnu poruchu a uľahčiť prácu lekárov. Prednáška Róberta Saba ukázala, ako sa táto technológia testuje s bežnými ľuďmi a kam smeruje.
Od rozpoznávania reči k prirodzenej komunikácii
Na diagnostiku z reči vedie dlhá cesta od spoľahlivého rozpoznávania slov. Tím stojí napríklad za automatickým prepisom diktátu APD, ktorý využívajú sudcovia, a za serverovým systémom SARA pre redaktorov, čo vie prepisovať nahraté videá a podcasty. Rozpoznávač beží na serveroch v spolupráci s Technickou univerzitou v Košiciach. V mobilnej aplikácii Rým zas rozpoznávanie sleduje text rozprávky a spúšťa ilustračné zvuky, ktoré deti vtiahnu do deja.
Na ústave vznikla aj slovenská syntéza reči vrátane expresívneho hlasu, ktorým dnes rozpráva sociálny robot. Výskum zahŕňa aj hlasovú biometriu, teda rozpoznanie hovoriaceho, a detekciu emócií či stresu v hlase. Keď sa tieto schopnosti spoja s dialógovým riadením, vzniká rozhranie, ktoré sa učí prispôsobovať človeku – napríklad tempom či reakciami – aby komunikácia pôsobila prirodzene.
Hlas ako okno do kognície
Prvým krokom k diagnostike bola pred piatimi rokmi aplikácia Eva, ocenená IT produkt roka 2023. Aplikácia administruje známe testy: pomenovávanie obrázkov aj voľný opis scénky, pri ktorom sa sleduje presnosť a zložitosť viet. Nahrávky sa spracujú na serveri, kde beží akustická analýza hlasu a neurónové siete trénované na dátach od vyše tisícky zdravých aj chorých ľudí. Systém vníma aj jemné prejavy, napríklad spomalené vybavenie slova, a na záver buď upokojí, alebo odporučí návštevu neurológa.
V aktuálnom projekte APVV už úlohy zadáva priamo sociálny robot. Človek hovorí do mikrofónu, reč prepisuje automatický rozpoznávač, dialógový manažér (pri zložitejších otázkach si vypýta radu od ChatGPT) pripraví odpoveď a syntéza reči ju plynulo prehrá so zarovnaním pohybov úst robota. Tím nazbieral okolo 200 rozhovorov, aj v rušnom prostredí Noci výskumníkov, a cielene testuje ľudí 50+, 60+ a osoby s miernou kognitívnou poruchou. Zaujímavý výsledok: čím starší respondenti, tým prirodzenejšia im komunikácia pripadala; až 90 % ľudí nad 50 rokov považovalo robota za vhodného na kognitívne testy, pričom mladší mávajú vyššie nároky, kým starší ľahšie prijmú nedokonalosti a vidia praktický prínos.
Čo zlepšujeme a kde to využívame
Najbližšie ciele smerujú k ešte plynulejšiemu dialógu. Robot sa má naučiť preberať iniciatívu bez čakania na dlhé ticho a rozpoznávať z intonácie, či človek dohovoril. Pracuje sa na prerušovaní reči robota (tzv. barge‑in), na emóciách v syntéze hlasu a na využití vizuálneho sledovania reakcií. V pláne sú aj nové úlohy a prenos metód z tabletového riešenia, aby systém vedel spoľahlivejšie odhaliť miernu kognitívnu poruchu či Alzheimerovu chorobu.
Keďže nie každá inštitúcia si môže dovoliť robota za približne 15-tisíc, tím vytvoril aj jeho virtuálnu verziu pre veľkú obrazovku. Asistent na vrátnici deteguje príchod, rozpozná tvár či hlas, pozdraví menom a cez prispôsobeného AI asistenta poskytne informácie o ústave. Návštevníkom poradí, kde sídli konkrétny pracovník, a zamestnancom zobrazí jedálne lístky z viacerých reštaurácií. Skúsenosti naznačujú, že ľudia sa s robotmi rozprávajú radi a tento prístup má šancu uplatniť sa aj v zdravotníctve.