Behöver du snabbt och automatiskt extrahera information från flera dokument? Och lagras de också i form av skanningar eller fotografier? Du har tur om du är kund hos Amazon Web Services (AWS). Amazon meddelade öppnandet av tillgång till
Enligt Amazon är Textract betydligt effektivare än konventionella optiska teckenigenkänningssystem. Från filer lagrade i en Amazon S3-hink kan den extrahera innehållet i fält och tabeller baserat på det sammanhang där informationen presenteras, som att automatiskt markera namn och personnummer på skatteformulär eller totalsummor på fotograferade kvitton. Som Amazon noterar i
Textract lagrar resultat i JSON-format, kommenterade med sidnummer, sektioner, formuläretiketter och datatyper, och integreras valfritt med databas- och analystjänster som Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena och produkter för maskininlärning. som Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate och Amazon SageMaker för efterbearbetning. Alternativt kan den extraherade informationen överföras direkt till tredjeparts molntjänster för redovisnings- och revisionsefterlevnadsändamål eller för att stödja intelligenta sökningar i dokumentarkiv. Enligt Amazon kan Textract "exakt" bearbeta miljontals sidor av olika dokument på "bara några timmar."
Många AWS-kunder använder redan Textract, inklusive Globe and Mail, Storbritanniens National Weather Service, PricewaterhouseCoopers, ideell vårdorganisation Healthfirst, och robotprocessautomationsföretagen UiPath, Ripcord och Blue Prism. Candor, en startup som syftar till att skapa transparens till bolånebranschen, använder Textract för att extrahera data från dokument som kontoutdrag, lönebesked och olika skattedokument för att påskynda lånegodkännandeprocessen för sina kunder.
"Kraften med Amazon Textract är att det exakt extraherar text och strukturerad data från praktiskt taget alla dokument utan behov av avancerad maskininlärning", säger Swami Sivasubramanian, vice vd för Amazon Machine Learning. "Förutom integrationen med andra AWS-tjänster tillåter det stora samhället som växer runt Amazon Textract våra kunder att få verkligt värde från sina filsamlingar, arbeta mer effektivt, förbättra säkerhetsefterlevnaden, automatisera datainmatning och påskynda affärsbeslut."
Nedan kan du se Textracts presentation på konferensen re:Invent 2018 på engelska.
Källa: 3dnews.ru