Moet u snel en automatisch informatie uit meerdere documenten halen? En worden ze ook opgeslagen in de vorm van scans of foto’s? Je hebt geluk als je een Amazon Web Services (AWS)-klant bent. Amazon kondigde de opening aan van toegang tot
Volgens Amazon is Textract aanzienlijk efficiënter dan conventionele optische tekenherkenningssystemen. Uit bestanden die zijn opgeslagen in een Amazon S3-bucket kan het de inhoud van velden en tabellen extraheren op basis van de context waarin die informatie wordt gepresenteerd, zoals het automatisch markeren van namen en burgerservicenummers op belastingformulieren of totalen op gefotografeerde bonnen. Zoals Amazon opmerkt
Textract slaat resultaten op in JSON-formaat, geannoteerd met paginanummers, secties, formulierlabels en gegevenstypen, en kan optioneel worden geïntegreerd met database- en analyseservices zoals Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena en machine learning-producten zoals Amazon Comprehend. , Amazon Comprehend Medical, Amazon Translate en Amazon SageMaker voor nabewerking. Als alternatief kunnen de geëxtraheerde gegevens rechtstreeks worden overgedragen naar clouddiensten van derden voor boekhoudkundige en auditdoeleinden of ter ondersteuning van intelligente zoekacties in documentarchieven. Volgens Amazon kan Textract miljoenen pagina's van verschillende documenten "nauwkeurig" verwerken in "slechts een paar uur".
Talrijke AWS-klanten maken al gebruik van Textract, waaronder de Globe and Mail, de Britse National Weather Service, PricewaterhouseCoopers, de non-profit managed care-organisatie Healthfirst en de robotprocesautomatiseringsbedrijven UiPath, Ripcord en Blue Prism. Candor, een startup die transparantie wil brengen in de hypotheeksector, gebruikt Textract om gegevens te extraheren uit documenten zoals bankafschriften, loonstrookjes en verschillende belastingdocumenten om het goedkeuringsproces voor leningen voor haar klanten te versnellen.
“De kracht van Amazon Textract is dat het nauwkeurig tekst en gestructureerde gegevens uit vrijwel elk document haalt, zonder de noodzaak van geavanceerd machine learning”, zegt Swami Sivasubramanian, vice-president van Amazon Machine Learning. “Naast de integratie met andere AWS-diensten stelt de grote gemeenschap die rond Amazon Textract groeit, onze klanten in staat echte waarde te halen uit hun bestandsverzamelingen, efficiënter te werken, de naleving van de beveiligingsvoorschriften te verbeteren, gegevensinvoer te automatiseren en zakelijke beslissingen te versnellen.”
Hieronder kunt u de presentatie van Textract op de re:Invent 2018 conferentie in het Engels bekijken.
Bron: 3dnews.ru