Trebate li brzo i automatski izdvojiti podatke iz više dokumenata? I pohranjuju li se i u obliku skenova ili fotografija? Imate sreće ako ste korisnik Amazon Web Services (AWS). Amazon je najavio otvaranje pristupa
Prema Amazonu, Texttract je znatno učinkovitiji od konvencionalnih sustava za optičko prepoznavanje znakova. Iz datoteka pohranjenih u spremniku Amazon S3 može izdvojiti sadržaj polja i tablica na temelju konteksta u kojem su te informacije predstavljene, poput automatskog isticanja imena i brojeva socijalnog osiguranja na poreznim obrascima ili ukupnih iznosa na fotografiranim računima. Kao što Amazon primjećuje u
Texttract pohranjuje rezultate u JSON formatu, označene brojevima stranica, odjeljcima, oznakama obrasca i vrstama podataka, te se po izboru integrira s bazama podataka i analitičkim uslugama kao što su Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena i proizvodi za strojno učenje kao što je Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate i Amazon SageMaker za naknadnu obradu. Alternativno, ekstrahirani podaci mogu se prenijeti izravno na usluge u oblaku trećih strana u svrhu usklađenosti računovodstva i revizije ili za podršku inteligentnog pretraživanja arhiva dokumenata. Prema Amazonu, Texttract može "precizno" obraditi milijune stranica različitih dokumenata u "samo nekoliko sati".
Brojni korisnici AWS-a već koriste Textract, uključujući Globe and Mail, Nacionalnu meteorološku službu Ujedinjenog Kraljevstva, PricewaterhouseCoopers, neprofitnu organizaciju za upravljanje skrbi Healthfirst i tvrtke za automatizaciju robotskih procesa UiPath, Ripcord i Blue Prism. Candor, startup čiji je cilj unijeti transparentnost u industriju hipotekarnih kredita, koristi Texttract za izdvajanje podataka iz dokumenata kao što su bankovni izvodi, popisi plaća i razni porezni dokumenti kako bi ubrzao proces odobravanja kredita za svoje klijente.
“Snaga Amazon Texttracta je u tome što točno izvlači tekst i strukturirane podatke iz gotovo bilo kojeg dokumenta bez potrebe za naprednim strojnim učenjem,” rekao je Swami Sivasubramanian, potpredsjednik Amazon Machine Learninga. "Osim integracije s drugim AWS uslugama, velika zajednica koja raste oko Amazon Texttracta omogućuje našim korisnicima da dobiju stvarnu vrijednost od svojih kolekcija datoteka, rade učinkovitije, poboljšaju sigurnosnu usklađenost, automatiziraju unos podataka i ubrzaju poslovne odluke."
U nastavku pogledajte izlaganje Texttracta na re:Invent 2018 konferenciji na engleskom jeziku.
Izvor: 3dnews.ru