Amazon käivitab pilvepõhise dokumendituvastusteenuse

Kas teil on vaja kiiresti ja automaatselt teavet mitmest dokumendist eraldada? Ja kas need on pealegi salvestatud skaneeritud või fotode kujul? Kui olete Amazon Web Servicesi (AWS) klient, on teil õnne. Amazon teatas juurdepääsu avamisest Tekstrakt, pilvepõhine ja täielikult hallatav teenus, mis kasutab masinõpet tabelite, tekstivormide ja tervete tekstilehtede analüüsimiseks populaarsetes elektroonilistes vormingutes. Praegu on see saadaval ainult valitud AWS-i piirkondades, täpsemalt USA idaosas (Ohio ja Põhja-Virginia), USA lääneosas (Oregon) ja EL-is (Iirimaa), kusjuures Textract jõuab börsile järgmisel aastal.

Amazon käivitab pilvepõhise dokumendituvastusteenuse

Amazoni sõnul on Textract oluliselt tõhusam kui tavalised optilised märgituvastussüsteemid. Amazon S3 ämbrisse salvestatud failidest saab see välja võtta väljade ja tabelite sisu, võttes arvesse selle teabe esitamise konteksti, näiteks tõstab süsteem automaatselt esile nimed ja sotsiaalkindlustuse numbrid maksuvormidel või kogusummad. pildistatud kviitungitest. Nagu Amazon märgib Pressiteade, Textract toetab pildivorminguid, nagu skaneeringud, PDF-id ja fotod, ning töötab tõhusalt finantsteenuste, kindlustuse ja tervishoiuga seotud dokumentide kontekstiga.

Textract salvestab tulemused JSON-vormingus, millele on lisatud leheküljenumbrid, jaotised, vormisildid ja andmetüübid, ning integreerub valikuliselt andmebaasi- ja analüüsiteenustega, nagu Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, ja masinõppetoodetega, nagu Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate ja Amazon SageMaker järeltöötluseks. Teise võimalusena saab väljavõetud andmed edastada otse kolmandate osapoolte pilveteenustele raamatupidamise ja nõuetele vastavuse auditeerimise eesmärgil või nutikate otsingute toetamiseks dokumendiarhiivides. Amazoni sõnul suudab Textract "täpselt" töödelda miljoneid lehekülgi erinevaid dokumente "ainult mõne tunniga".

Paljud AWS-i kliendid kasutavad juba Textracti, sealhulgas Globe and Mail, Ühendkuningriigi riiklik ilmateenistus, PricewaterhouseCoopers, Healthfirst, mittetulunduslik hallatud hooldusorganisatsioon ning robotprotsesside automatiseerimise ettevõtted UiPath, Ripcord ja Blue Prism. Candor, idufirma, mille eesmärk on tuua hüpoteeklaenusektorisse läbipaistvust, kasutab Textracti andmete hankimiseks sellistest dokumentidest nagu pangaväljavõtted, maksekäsud ja erinevad maksudokumendid, et kiirendada oma klientide laenude kinnitamise protsessi.

"Amazon Textracti võimsus seisneb selles, et see ekstraheerib täpselt teksti- ja struktureeritud andmed peaaegu igast dokumendist ilma eelneva masinõppeta," ütles Amazon Machine Learningi asepresident Swami Sivasubramanian. "Lisaks teiste AWS-i teenustega integreerimisele võimaldab Amazon Textracti ümber kasvav suur kogukond meie klientidel saada oma failikogudest tõelist väärtust, töötada tõhusamalt, parandada turvalisuse vastavust, automatiseerida andmete sisestamist ja kiirendada äriotsuseid."

Allpool saate vaadata Textracti esitlust saidil re:Invent 2018 inglise keeles.



Allikas: 3dnews.ru

Lisa kommentaar