Amazon lanceert clouddienst voor documentherkenning

Moet u snel en automatisch informatie uit meerdere documenten halen? En worden ze ook opgeslagen in de vorm van scans of foto’s? Je hebt geluk als je een Amazon Web Services (AWS)-klant bent. Amazon kondigde de opening aan van toegang tot T-extract, een cloudgebaseerde en volledig beheerde service die machine learning gebruikt om tabellen, tekstformulieren en hele pagina's met tekst in populaire elektronische formaten te analyseren. Voorlopig zal het alleen beschikbaar zijn in geselecteerde AWS-regio's, met name het oosten van de VS (Ohio en Noord-Virginia), het westen van de VS (Oregon) en de EU (Ierland), maar volgend jaar zal Textract voor iedereen beschikbaar zijn.

Amazon lanceert clouddienst voor documentherkenning

Volgens Amazon is Textract aanzienlijk efficiënter dan conventionele optische tekenherkenningssystemen. Uit bestanden die zijn opgeslagen in een Amazon S3-bucket kan het de inhoud van velden en tabellen extraheren op basis van de context waarin die informatie wordt gepresenteerd, zoals het automatisch markeren van namen en burgerservicenummers op belastingformulieren of totalen op gefotografeerde bonnen. Zoals Amazon opmerkt persberichtondersteunt Textract afbeeldingsformaten zoals scans, pdf's en foto's, en werkt effectief met context in documenten die specifiek zijn voor financiële diensten, verzekeringen en gezondheidszorg.

Textract slaat resultaten op in JSON-formaat, geannoteerd met paginanummers, secties, formulierlabels en gegevenstypen, en kan optioneel worden geïntegreerd met database- en analyseservices zoals Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena en machine learning-producten zoals Amazon Comprehend. , Amazon Comprehend Medical, Amazon Translate en Amazon SageMaker voor nabewerking. Als alternatief kunnen de geëxtraheerde gegevens rechtstreeks worden overgedragen naar clouddiensten van derden voor boekhoudkundige en auditdoeleinden of ter ondersteuning van intelligente zoekacties in documentarchieven. Volgens Amazon kan Textract miljoenen pagina's van verschillende documenten "nauwkeurig" verwerken in "slechts een paar uur".

Talrijke AWS-klanten maken al gebruik van Textract, waaronder de Globe and Mail, de Britse National Weather Service, PricewaterhouseCoopers, de non-profit managed care-organisatie Healthfirst en de robotprocesautomatiseringsbedrijven UiPath, Ripcord en Blue Prism. Candor, een startup die transparantie wil brengen in de hypotheeksector, gebruikt Textract om gegevens te extraheren uit documenten zoals bankafschriften, loonstrookjes en verschillende belastingdocumenten om het goedkeuringsproces voor leningen voor haar klanten te versnellen.

“De kracht van Amazon Textract is dat het nauwkeurig tekst en gestructureerde gegevens uit vrijwel elk document haalt, zonder de noodzaak van geavanceerd machine learning”, zegt Swami Sivasubramanian, vice-president van Amazon Machine Learning. “Naast de integratie met andere AWS-diensten stelt de grote gemeenschap die rond Amazon Textract groeit, onze klanten in staat echte waarde te halen uit hun bestandsverzamelingen, efficiënter te werken, de naleving van de beveiligingsvoorschriften te verbeteren, gegevensinvoer te automatiseren en zakelijke beslissingen te versnellen.”

Hieronder kunt u de presentatie van Textract op de re:Invent 2018 conferentie in het Engels bekijken.



Bron: 3dnews.ru

Voeg een reactie