Kas teil on vaja kiiresti ja automaatselt teavet mitmest dokumendist eraldada? Ja kas need on pealegi salvestatud skaneeritud või fotode kujul? Kui olete Amazon Web Servicesi (AWS) klient, on teil õnne. Amazon teatas juurdepääsu avamisest
Amazoni sõnul on Textract oluliselt tõhusam kui tavalised optilised märgituvastussüsteemid. Amazon S3 ämbrisse salvestatud failidest saab see välja võtta väljade ja tabelite sisu, võttes arvesse selle teabe esitamise konteksti, näiteks tõstab süsteem automaatselt esile nimed ja sotsiaalkindlustuse numbrid maksuvormidel või kogusummad. pildistatud kviitungitest. Nagu Amazon märgib
Textract salvestab tulemused JSON-vormingus, millele on lisatud leheküljenumbrid, jaotised, vormisildid ja andmetüübid, ning integreerub valikuliselt andmebaasi- ja analüüsiteenustega, nagu Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, ja masinõppetoodetega, nagu Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate ja Amazon SageMaker järeltöötluseks. Teise võimalusena saab väljavõetud andmed edastada otse kolmandate osapoolte pilveteenustele raamatupidamise ja nõuetele vastavuse auditeerimise eesmärgil või nutikate otsingute toetamiseks dokumendiarhiivides. Amazoni sõnul suudab Textract "täpselt" töödelda miljoneid lehekülgi erinevaid dokumente "ainult mõne tunniga".
Paljud AWS-i kliendid kasutavad juba Textracti, sealhulgas Globe and Mail, Ühendkuningriigi riiklik ilmateenistus, PricewaterhouseCoopers, Healthfirst, mittetulunduslik hallatud hooldusorganisatsioon ning robotprotsesside automatiseerimise ettevõtted UiPath, Ripcord ja Blue Prism. Candor, idufirma, mille eesmärk on tuua hüpoteeklaenusektorisse läbipaistvust, kasutab Textracti andmete hankimiseks sellistest dokumentidest nagu pangaväljavõtted, maksekäsud ja erinevad maksudokumendid, et kiirendada oma klientide laenude kinnitamise protsessi.
"Amazon Textracti võimsus seisneb selles, et see ekstraheerib täpselt teksti- ja struktureeritud andmed peaaegu igast dokumendist ilma eelneva masinõppeta," ütles Amazon Machine Learningi asepresident Swami Sivasubramanian. "Lisaks teiste AWS-i teenustega integreerimisele võimaldab Amazon Textracti ümber kasvav suur kogukond meie klientidel saada oma failikogudest tõelist väärtust, töötada tõhusamalt, parandada turvalisuse vastavust, automatiseerida andmete sisestamist ja kiirendada äriotsuseid."
Allpool saate vaadata Textracti esitlust saidil re:Invent 2018 inglise keeles.
Allikas: 3dnews.ru