Amazon lansira uslugu u oblaku za prepoznavanje dokumenata

Trebate li brzo i automatski izdvojiti podatke iz više dokumenata? I pohranjuju li se i u obliku skenova ili fotografija? Imate sreće ako ste korisnik Amazon Web Services (AWS). Amazon je najavio otvaranje pristupa Ekstrakt, potpuno upravljana usluga temeljena na oblaku koja koristi strojno učenje za analizu tablica, tekstualnih obrazaca i cijelih stranica teksta u popularnim elektroničkim formatima. Za sada će biti dostupan samo u odabranim regijama AWS-a, točnije u istočnom SAD-u (Ohio i Sjeverna Virginia), zapadnom SAD-u (Oregon) i EU (Irska), no sljedeće godine Texttract će biti dostupan svima.

Amazon lansira uslugu u oblaku za prepoznavanje dokumenata

Prema Amazonu, Texttract je znatno učinkovitiji od konvencionalnih sustava za optičko prepoznavanje znakova. Iz datoteka pohranjenih u spremniku Amazon S3 može izdvojiti sadržaj polja i tablica na temelju konteksta u kojem su te informacije predstavljene, poput automatskog isticanja imena i brojeva socijalnog osiguranja na poreznim obrascima ili ukupnih iznosa na fotografiranim računima. Kao što Amazon primjećuje u priopćenje za javnost, Texttract podržava slikovne formate kao što su skenovi, PDF-ovi i fotografije te učinkovito radi s kontekstom u dokumentima specifičnim za financijske usluge, osiguranje i zdravstvenu skrb.

Texttract pohranjuje rezultate u JSON formatu, označene brojevima stranica, odjeljcima, oznakama obrasca i vrstama podataka, te se po izboru integrira s bazama podataka i analitičkim uslugama kao što su Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena i proizvodi za strojno učenje kao što je Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate i Amazon SageMaker za naknadnu obradu. Alternativno, ekstrahirani podaci mogu se prenijeti izravno na usluge u oblaku trećih strana u svrhu usklađenosti računovodstva i revizije ili za podršku inteligentnog pretraživanja arhiva dokumenata. Prema Amazonu, Texttract može "precizno" obraditi milijune stranica različitih dokumenata u "samo nekoliko sati".

Brojni korisnici AWS-a već koriste Textract, uključujući Globe and Mail, Nacionalnu meteorološku službu Ujedinjenog Kraljevstva, PricewaterhouseCoopers, neprofitnu organizaciju za upravljanje skrbi Healthfirst i tvrtke za automatizaciju robotskih procesa UiPath, Ripcord i Blue Prism. Candor, startup čiji je cilj unijeti transparentnost u industriju hipotekarnih kredita, koristi Texttract za izdvajanje podataka iz dokumenata kao što su bankovni izvodi, popisi plaća i razni porezni dokumenti kako bi ubrzao proces odobravanja kredita za svoje klijente.

“Snaga Amazon Texttracta je u tome što točno izvlači tekst i strukturirane podatke iz gotovo bilo kojeg dokumenta bez potrebe za naprednim strojnim učenjem,” rekao je Swami Sivasubramanian, potpredsjednik Amazon Machine Learninga. "Osim integracije s drugim AWS uslugama, velika zajednica koja raste oko Amazon Texttracta omogućuje našim korisnicima da dobiju stvarnu vrijednost od svojih kolekcija datoteka, rade učinkovitije, poboljšaju sigurnosnu usklađenost, automatiziraju unos podataka i ubrzaju poslovne odluke."

U nastavku pogledajte izlaganje Texttracta na re:Invent 2018 konferenciji na engleskom jeziku.



Izvor: 3dnews.ru

Dodajte komentar