Amazon lancerer cloud-baseret dokumentgenkendelsestjeneste

Har du brug for hurtigt og automatisk at udtrække information fra flere dokumenter? Og gemmes de i øvrigt i form af scanninger eller fotografier? Du er heldig, hvis du er kunde hos Amazon Web Services (AWS). Amazon annoncerede åbningen af ​​adgang til Tekstrakt, en cloud-baseret og fuldt administreret tjeneste, der bruger maskinlæring til at analysere tabeller, tekstformularer og hele sider med tekst i populære elektroniske formater. Indtil videre vil det kun være tilgængeligt i udvalgte AWS-regioner, specifikt det østlige USA (Ohio og det nordlige Virginia), det vestlige USA (Oregon) og EU (Irland), hvor Textract bliver offentliggjort næste år.

Amazon lancerer cloud-baseret dokumentgenkendelsestjeneste

Ifølge Amazon er Textract væsentligt mere effektivt end konventionelle optiske tegngenkendelsessystemer. Fra filer, der er gemt i en Amazon S3-bøtte, kan den udtrække indholdet af felter og tabeller under hensyntagen til den kontekst, hvori disse oplysninger præsenteres, f.eks. fremhæver systemet automatisk navne og personnumre på skatteformularer eller totalerne af fotograferede kvitteringer. Som Amazon bemærker i pressemeddelelse, Textract understøtter billedformater såsom scanninger, PDF'er og fotos og arbejder effektivt med kontekst i dokumenter, der er specifikke for finansielle tjenester, forsikring og sundhedspleje.

Textract gemmer resultater i JSON-format, der er kommenteret med sidetal, sektioner, formularetiketter og datatyper, og kan eventuelt integreres med database- og analysetjenester såsom Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena og maskinlæringsprodukter, såsom Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate og Amazon SageMaker til efterbehandling. Alternativt kan de udtrukne data overføres direkte til tredjeparts cloud-tjenester til regnskabs- og revisionsformål eller for at understøtte smarte søgninger i dokumentarkiver. Ifølge Amazon kan Textract "nøjagtigt" behandle millioner af sider af forskellige dokumenter på "bare få timer."

Mange AWS-kunder bruger allerede Textract, herunder Globe and Mail, UK National Weather Service, PricewaterhouseCoopers, Healthfirst, en non-profit administreret plejeorganisation og robotprocesautomatiseringsvirksomheder UiPath, Ripcord og Blue Prism. Candor, en startup, der har til formål at bringe gennemsigtighed til realkreditbranchen, bruger Textract til at udtrække data fra dokumenter såsom kontoudtog, lønsedler og forskellige skattedokumenter for at fremskynde lånegodkendelsesprocessen for sine kunder.

"Kraften ved Amazon Textract er, at det præcist udtrækker tekstlige og strukturerede data fra stort set ethvert dokument uden behov for forudgående maskinlæring," sagde Swami Sivasubramanian, vicepræsident for Amazon Machine Learning. "Ud over at integrere med andre AWS-tjenester, gør det store samfund, der vokser omkring Amazon Textract, vores kunder i stand til at få reel værdi ud af deres filsamlinger, arbejde mere effektivt, forbedre sikkerhedsoverholdelse, automatisere dataindtastning og fremskynde forretningsbeslutninger."

Herunder kan du se Textracts oplæg på re:Invent 2018 på engelsk.



Kilde: 3dnews.ru

Tilføj en kommentar