Amazon lansira storitev v oblaku za prepoznavanje dokumentov

Ali morate hitro in samodejno izvleči informacije iz več dokumentov? In ali so shranjeni tudi v obliki skenov ali fotografij? Če ste uporabnik Amazon Web Services (AWS), imate srečo. Amazon je napovedal odprtje dostopa do Besedilo, v oblaku temelječa in popolnoma upravljana storitev, ki uporablja strojno učenje za analizo tabel, besedilnih obrazcev in celih strani besedila v priljubljenih elektronskih formatih. Zaenkrat bo na voljo samo v izbranih regijah AWS, natančneje v vzhodnih ZDA (Ohio in Severna Virginija), zahodnih ZDA (Oregon) in EU (Irska), naslednje leto pa bo Texttract na voljo vsem.

Amazon lansira storitev v oblaku za prepoznavanje dokumentov

Po mnenju Amazona je Texttract bistveno učinkovitejši od običajnih sistemov za optično prepoznavanje znakov. Iz datotek, shranjenih v vedru Amazon S3, lahko izvleče vsebino polj in tabel glede na kontekst, v katerem so te informacije predstavljene, kot je samodejno poudarjanje imen in številk socialnega zavarovanja na davčnih obrazcih ali skupnih vrednostih na fotografiranih potrdilih. Kot ugotavlja Amazon v sporočilo za javnost, Texttract podpira formate slik, kot so skenirani dokumenti, PDF-ji in fotografije, ter učinkovito deluje s kontekstom v dokumentih, specifičnih za finančne storitve, zavarovanje in zdravstveno varstvo.

Texttract shranjuje rezultate v obliki zapisa JSON, označene s številkami strani, razdelki, oznakami obrazcev in tipi podatkov, ter se po želji integrira z bazami podatkov in analitičnimi storitvami, kot so Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena in izdelki za strojno učenje, kot je Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate in Amazon SageMaker za naknadno obdelavo. Druga možnost je, da se ekstrahirani podatki prenesejo neposredno v storitve v oblaku tretjih oseb za namene skladnosti računovodstva in revizije ali za podporo inteligentnega iskanja arhivov dokumentov. Po mnenju Amazona lahko Texttract "natančno" obdela milijone strani različnih dokumentov v "le nekaj urah".

Številne stranke AWS že uporabljajo Texttract, vključno z Globe and Mail, Nacionalno vremensko službo Združenega kraljestva, PricewaterhouseCoopers, neprofitno organizacijo za upravljano nego Healthfirst in podjetji za avtomatizacijo robotskih procesov UiPath, Ripcord in Blue Prism. Candor, zagonsko podjetje, katerega cilj je vnesti preglednost v hipotekarno industrijo, uporablja Texttract za pridobivanje podatkov iz dokumentov, kot so bančni izpiski, plačilne liste in različni davčni dokumenti, da pospeši postopek odobritve posojila za svoje stranke.

»Moč Amazon Texttract je v tem, da natančno izvleče besedilo in strukturirane podatke iz tako rekoč katerega koli dokumenta brez potrebe po naprednem strojnem učenju,« je povedal Swami Sivasubramanian, podpredsednik Amazon Machine Learning. »Poleg integracije z drugimi storitvami AWS velika skupnost, ki raste okoli Amazon Texttract, omogoča našim strankam, da pridobijo resnično vrednost iz svojih zbirk datotek, delajo učinkoviteje, izboljšajo varnostno skladnost, avtomatizirajo vnos podatkov in pospešijo poslovne odločitve.«

Spodaj si lahko ogledate predstavitev Texttracta na konferenci re:Invent 2018 v angleškem jeziku.



Vir: 3dnews.ru

Dodaj komentar