Amazon lanserar molntjänst för dokumentigenkänning

Behöver du snabbt och automatiskt extrahera information från flera dokument? Och lagras de också i form av skanningar eller fotografier? Du har tur om du är kund hos Amazon Web Services (AWS). Amazon meddelade öppnandet av tillgång till Textrace, en molnbaserad och helt hanterad tjänst som använder maskininlärning för att analysera tabeller, textformulär och hela sidor med text i populära elektroniska format. För närvarande kommer den bara att vara tillgänglig i utvalda AWS-regioner, specifikt östra USA (Ohio och norra Virginia), västra USA (Oregon) och EU (Irland), men nästa år kommer Textract att vara tillgänglig för alla.

Amazon lanserar molntjänst för dokumentigenkänning

Enligt Amazon är Textract betydligt effektivare än konventionella optiska teckenigenkänningssystem. Från filer lagrade i en Amazon S3-hink kan den extrahera innehållet i fält och tabeller baserat på det sammanhang där informationen presenteras, som att automatiskt markera namn och personnummer på skatteformulär eller totalsummor på fotograferade kvitton. Som Amazon noterar i pressmeddelandeTextract stöder bildformat som skanningar, PDF-filer och fotografier, och arbetar effektivt med sammanhang i dokument som är specifika för finansiella tjänster, försäkringar och sjukvård.

Textract lagrar resultat i JSON-format, kommenterade med sidnummer, sektioner, formuläretiketter och datatyper, och integreras valfritt med databas- och analystjänster som Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena och produkter för maskininlärning. som Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate och Amazon SageMaker för efterbearbetning. Alternativt kan den extraherade informationen överföras direkt till tredjeparts molntjänster för redovisnings- och revisionsefterlevnadsändamål eller för att stödja intelligenta sökningar i dokumentarkiv. Enligt Amazon kan Textract "exakt" bearbeta miljontals sidor av olika dokument på "bara några timmar."

Många AWS-kunder använder redan Textract, inklusive Globe and Mail, Storbritanniens National Weather Service, PricewaterhouseCoopers, ideell vårdorganisation Healthfirst, och robotprocessautomationsföretagen UiPath, Ripcord och Blue Prism. Candor, en startup som syftar till att skapa transparens till bolånebranschen, använder Textract för att extrahera data från dokument som kontoutdrag, lönebesked och olika skattedokument för att påskynda lånegodkännandeprocessen för sina kunder.

"Kraften med Amazon Textract är att det exakt extraherar text och strukturerad data från praktiskt taget alla dokument utan behov av avancerad maskininlärning", säger Swami Sivasubramanian, vice vd för Amazon Machine Learning. "Förutom integrationen med andra AWS-tjänster tillåter det stora samhället som växer runt Amazon Textract våra kunder att få verkligt värde från sina filsamlingar, arbeta mer effektivt, förbättra säkerhetsefterlevnaden, automatisera datainmatning och påskynda affärsbeslut."

Nedan kan du se Textracts presentation på konferensen re:Invent 2018 på engelska.



Källa: 3dnews.ru

Lägg en kommentar