Amazon lanseart wolk-basearre tsjinst foar dokumintherkenning

Moatte jo ynformaasje fluch en automatysk ekstrahearje út meardere dokuminten? En wurde se boppedat bewarre yn 'e foarm fan scans of foto's? Jo hawwe gelok as jo in Amazon Web Services (AWS) klant binne. Amazon kundige de iepening fan tagong ta Textrace, in wolk-basearre en folslein beheare tsjinst dy't masine learen brûkt om tabellen, tekstfoarmen en hiele siden fan tekst te analysearjen yn populêre elektroanyske formaten. Foar no sil it allinich beskikber wêze yn selekteare AWS-regio's, spesifyk de US East (Ohio en Noard-Firginia), US West (Oregon), en EU (Ierlân), mei Textract dat takom jier iepenbier wurdt.

Amazon lanseart wolk-basearre tsjinst foar dokumintherkenning

Neffens Amazon is Textract signifikant effisjinter dan konvinsjonele systemen foar optyske karakterherkenning. Fan bestannen opslein yn in Amazon S3-emmer kin it de ynhâld fan fjilden en tabellen ekstrahearje, rekken hâldend mei de kontekst wêryn dizze ynformaasje wurdt presintearre, bygelyks it systeem markeart automatysk de nammen en sosjale feiligensnûmers op belestingformulieren as de totalen fan fotografearre ûntfangsten. As Amazon opmerkt yn parseberjocht, Textract stipet byldformaten lykas scans, PDF's en foto's, en wurket effisjint mei kontekst yn dokuminten spesifyk foar finansjele tsjinsten, fersekering en sûnenssoarch.

Textract slaat resultaten op yn JSON-formaat annotearre mei sidenûmers, seksjes, formulieretiketten en gegevenstypen, en yntegreart opsjoneel mei database- en analytyske tsjinsten lykas Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, en masinelearprodukten, lykas Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate, en Amazon SageMaker foar postferwurking. As alternatyf kinne de ekstrahearre gegevens direkt wurde oerbrocht nei wolktsjinsten fan tredden foar doelen fan boekhâlding en kontrôle neilibjen of om tûke sykopdrachten te stypjen yn dokumintargiven. Neffens Amazon kin Textract "krekt" miljoenen siden fan ferskate dokuminten yn "mar in pear oeren" ferwurkje.

In protte AWS-klanten brûke al Textract, ynklusyf Globe and Mail, de UK National Weather Service, PricewaterhouseCoopers, Healthfirst, in non-profit managed care organisaasje, en robotyske prosesautomatisearring bedriuwen UiPath, Ripcord, en Blue Prism. Candor, in startup dy't as doel hat om transparânsje te bringen yn 'e hypoteekyndustry, brûkt Textract om gegevens te ekstrahearjen út dokuminten lykas bankôfskriften, beteljen en ferskate belestingdokuminten om it proses foar goedkarring fan lieningen foar har kliïnten te rapperjen.

"De krêft fan Amazon Textract is dat it tekstuele en strukturearre gegevens sekuer ekstrakt út praktysk elk dokumint sûnder de needsaak foar foarôfgeande masine-learen," sei Swami Sivasubramanian, fise-presidint fan Amazon Machine Learning. "Njonken it yntegrearjen mei oare AWS-tsjinsten, stelt de grutte mienskip dy't groeit om Amazon Textract ús klanten yn steat om echte wearde út har bestânkolleksjes te heljen, effisjinter te wurkjen, befeiligingskonformiteit te ferbetterjen, gegevensynfier te automatisearjen en saaklike besluten te fersnellen."

Hjirûnder kinne jo de presintaasje fan Textract besjen by re:Invent 2018 yn it Ingelsk.



Boarne: 3dnews.ru

Add a comment