Amazon stel wolk-gebaseerde dokumentherkenningsdiens bekend

Moet u inligting vinnig en outomaties uit verskeie dokumente onttrek? En word dit boonop in die vorm van skanderings of foto's gestoor? Jy is gelukkig as jy 'n Amazon Web Services (AWS)-kliënt is. Amazon het die opening van toegang tot Teksoefening, 'n wolk-gebaseerde en ten volle bestuurde diens wat masjienleer gebruik om tabelle, teksvorms en hele bladsye teks in gewilde elektroniese formate te ontleed. Vir eers sal dit slegs in sekere AWS-streke beskikbaar wees, spesifiek die VSA-Oos (Ohio en Noord-Virginia), VSA-Wes (Oregon) en EU (Ierland), met Textract wat volgende jaar bekend sal wees.

Amazon stel wolk-gebaseerde dokumentherkenningsdiens bekend

Volgens Amazon is Textract aansienlik meer doeltreffend as konvensionele optiese karakterherkenningstelsels. Uit lêers wat in 'n Amazon S3-emmer gestoor is, kan dit die inhoud van velde en tabelle onttrek, met inagneming van die konteks waarin hierdie inligting aangebied word, byvoorbeeld, die stelsel beklemtoon outomaties die name en sosiale sekerheidsnommers op belastingvorms of die totale van gefotografeerde kwitansies. Soos Amazon opmerk in persverklaring, Textract ondersteun beeldformate soos skanderings, PDF's en foto's, en werk doeltreffend met konteks in dokumente spesifiek vir finansiële dienste, versekering en gesondheidsorg.

Textract stoor resultate in JSON-formaat wat met bladsynommers, afdelings, vormetikette en datatipes geannoteer is, en kan opsioneel integreer met databasis- en ontledingsdienste soos Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena en masjienleerprodukte, soos Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate en Amazon SageMaker vir naverwerking. Alternatiewelik kan die onttrekde data direk na derdeparty-wolkdienste oorgedra word vir rekeningkundige en oudit-nakomingsdoeleindes of om slim soektogte in dokumentargiewe te ondersteun. Volgens Amazon kan Textract miljoene bladsye van verskillende dokumente "akkuraat" verwerk in "net 'n paar uur."

Baie AWS-kliënte gebruik reeds Textract, insluitend Globe and Mail, die UK National Weather Service, PricewaterhouseCoopers, Healthfirst, 'n nie-winsgewende bestuurde sorgorganisasie, en robotiese proses-outomatiseringsmaatskappye UiPath, Ripcord en Blue Prism. Candor, 'n beginonderneming wat daarop gemik is om deursigtigheid na die verbandbedryf te bring, gebruik Textract om data uit dokumente soos bankstate, betaalstrokies en verskeie belastingdokumente te onttrek om die leningsgoedkeuringsproses vir sy kliënte te bespoedig.

"Die krag van Amazon Textract is dat dit tekstuele en gestruktureerde data akkuraat uit feitlik enige dokument onttrek sonder die behoefte aan vooraf masjienleer," sê Swami Sivasubramanian, vise-president van Amazon Machine Learning. "Benewens die integrasie met ander AWS-dienste, stel die groot gemeenskap wat rondom Amazon Textract groei, ons kliënte in staat om werklike waarde uit hul lêerversamelings te kry, meer doeltreffend te werk, sekuriteitsnakoming te verbeter, data-invoer te outomatiseer en besigheidsbesluite te versnel."

Hieronder kan jy na Textract se aanbieding by re:Invent 2018 in Engels kyk.



Bron: 3dnews.ru

Voeg 'n opmerking