Amazon lanserer skytjeneste for dokumentgjenkjenning

Trenger du raskt og automatisk trekke ut informasjon fra flere dokumenter? Og er de også lagret i form av skanninger eller fotografier? Du er heldig hvis du er en Amazon Web Services-kunde (AWS). Amazon annonserte åpningen av tilgang til Tekstrakt, en skybasert og fullt administrert tjeneste som bruker maskinlæring til å analysere tabeller, tekstskjemaer og hele sider med tekst i populære elektroniske formater. Foreløpig vil den bare være tilgjengelig i utvalgte AWS-regioner, nærmere bestemt Øst-USA (Ohio og Nord-Virginia), Vest-USA (Oregon) og EU (Irland), men neste år vil Textract være tilgjengelig for alle.

Amazon lanserer skytjeneste for dokumentgjenkjenning

I følge Amazon er Textract betydelig mer effektiv enn konvensjonelle optiske tegngjenkjenningssystemer. Fra filer som er lagret i en Amazon S3-bøtte, kan den trekke ut innholdet i felt og tabeller basert på konteksten som informasjonen presenteres i, for eksempel automatisk utheving av navn og personnummer på skatteskjemaer eller totaler på fotograferte kvitteringer. Som Amazon bemerker i pressemelding, Textract støtter bildeformater som skanninger, PDF-er og fotografier, og fungerer effektivt med kontekst i dokumenter som er spesifikke for finansielle tjenester, forsikring og helsetjenester.

Textract lagrer resultater i JSON-format, annotert med sidetall, seksjoner, skjemaetiketter og datatyper, og kan eventuelt integreres med database- og analysetjenester som Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena og maskinlæringsprodukter. som Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate og Amazon SageMaker for etterbehandling. Alternativt kan de utpakkede dataene overføres direkte til tredjeparts skytjenester for regnskaps- og revisjonsformål eller for å støtte intelligente søk i dokumentarkiver. I følge Amazon kan Textract "nøyaktig" behandle millioner av sider med forskjellige dokumenter på "bare noen få timer."

Tallrike AWS-kunder bruker allerede Textract, inkludert Globe and Mail, Storbritannias National Weather Service, PricewaterhouseCoopers, non-profit administrert omsorgsorganisasjon Healthfirst, og robotprosessautomatiseringsselskapene UiPath, Ripcord og Blue Prism. Candor, en oppstart som har som mål å bringe transparens til boliglånsbransjen, bruker Textract til å trekke ut data fra dokumenter som kontoutskrifter, lønnsslipper og ulike skattedokumenter for å fremskynde godkjenningsprosessen for sine kunder.

"Kraften til Amazon Textract er at den nøyaktig trekker ut tekst og strukturerte data fra praktisk talt alle dokumenter uten behov for avansert maskinlæring," sa Swami Sivasubramanian, visepresident for Amazon Machine Learning. "I tillegg til integrasjon med andre AWS-tjenester, lar det store fellesskapet som vokser rundt Amazon Textract våre kunder få reell verdi fra filsamlingene sine, jobbe mer effektivt, forbedre sikkerhetsoverholdelse, automatisere datainntasting og akselerere forretningsbeslutninger."

Nedenfor kan du se Textracts presentasjon på re:Invent 2018-konferansen på engelsk.



Kilde: 3dnews.ru

Legg til en kommentar