La MDG-grupo de kompanioj, parto de la Sberbank-ekosistemo, anoncis la disvolviĝon de altnivela platformo de parolsintezo, kiu laŭdire certigas glatan kaj esprimplenan legadon de iu ajn teksto.
La prezentita solvo estas la tria generacio de la parolsinteza sistemo. Altkvalitaj sonsignaloj estas generitaj de kompleksaj neŭralaj retaj modeloj. La programistoj asertas, ke la rezulto de ĉi tiuj algoritmoj estas la plej realisma sintezo de ruslingva parolado.
La platformo inkluzivas modulon por antaŭdiri streĉon en vortoj, kiuj ankoraŭ ne estas en la baza vortaro. Krome, aŭtomata korekto de oftaj literumaj eraroj estas disponigita. Dank' al profunda lingva analizo de la teksto, la prononco respondas al la normoj de la lingvo eĉ en malfacilaj kazoj.
Alia avantaĝo de la platformo estas, ke ĝi ne postulas multekostajn servilojn ekipitajn per GPU-akceliloj. Vi povas uzi la teknologion en du manieroj: per nuba servo aŭ integrante ĝin en vian propran solvon.
Inter la eblaj kampoj de apliko de la disvolviĝo estas babilbots kaj voĉaj asistantoj, informaj kaj sciigaj servoj, voĉaj servoj kun tuja sintezo de iu ajn teksto dum voko, ktp.
"En aŭtomatigitaj scenaroj de komunikado kun klientoj, la teknologio permesas vin interagi individue kun ĉiu abonanto, ĉar ne estas fiksaj mesaĝoj, kaj ajna teksto povas esti sintezita dum la alvoko," diras la programistoj.
Vi povas provi la teknologion
fonto: 3dnews.ru