Amazon führt cloudbasierten Dokumentenerkennungsdienst ein

Müssen Sie Informationen aus mehreren Dokumenten schnell und automatisch extrahieren? Und werden sie darüber hinaus in Form von Scans oder Fotos gespeichert? Wenn Sie Kunde von Amazon Web Services (AWS) sind, haben Sie Glück. Amazon hat die Öffnung des Zugangs zu angekündigt Texttrakt, ein cloudbasierter und vollständig verwalteter Dienst, der maschinelles Lernen nutzt, um Tabellen, Textformen und ganze Textseiten in gängigen elektronischen Formaten zu analysieren. Derzeit wird es nur in ausgewählten AWS-Regionen verfügbar sein, insbesondere im Osten der USA (Ohio und Nord-Virginia), im Westen der USA (Oregon) und in der EU (Irland). Textract wird nächstes Jahr an die Börse gehen.

Amazon führt cloudbasierten Dokumentenerkennungsdienst ein

Laut Amazon ist Textract deutlich effizienter als herkömmliche optische Zeichenerkennungssysteme. Aus Dateien, die in einem Amazon S3-Bucket gespeichert sind, kann es den Inhalt von Feldern und Tabellen extrahieren und dabei den Kontext berücksichtigen, in dem diese Informationen dargestellt werden. So hebt das System beispielsweise automatisch die Namen und Sozialversicherungsnummern auf Steuerformularen oder die Gesamtsummen hervor von fotografierten Quittungen. Wie Amazon feststellt PressemitteilungTextract unterstützt Bildformate wie Scans, PDFs und Fotos und arbeitet effizient mit dem Kontext in Dokumenten speziell für Finanzdienstleistungen, Versicherungen und Gesundheitswesen.

Textract speichert Ergebnisse im JSON-Format mit Anmerkungen zu Seitenzahlen, Abschnitten, Formularbeschriftungen und Datentypen und lässt sich optional in Datenbank- und Analysedienste wie Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena und Produkte für maschinelles Lernen wie Amazon Comprehend integrieren. Amazon Comprehend Medical, Amazon Translate und Amazon SageMaker für die Nachbearbeitung. Alternativ können die extrahierten Daten zu Buchhaltungs- und Revisionszwecken oder zur Unterstützung intelligenter Suchen in Dokumentenarchiven direkt an Cloud-Dienste Dritter übertragen werden. Laut Amazon kann Textract Millionen von Seiten unterschiedlicher Dokumente in „nur wenigen Stunden“ „präzise“ verarbeiten.

Viele AWS-Kunden nutzen Textract bereits, darunter Globe and Mail, der britische National Weather Service, PricewaterhouseCoopers, Healthfirst, eine gemeinnützige Managed-Care-Organisation, und die Unternehmen für robotergestützte Prozessautomatisierung UiPath, Ripcord und Blue Prism. Candor, ein Startup, das sich zum Ziel gesetzt hat, Transparenz in die Hypothekenbranche zu bringen, nutzt Textract, um Daten aus Dokumenten wie Kontoauszügen, Gehaltsabrechnungen und verschiedenen Steuerdokumenten zu extrahieren und so den Kreditgenehmigungsprozess für seine Kunden zu beschleunigen.

„Die Stärke von Amazon Textract besteht darin, dass es Text- und Strukturdaten aus praktisch jedem Dokument präzise extrahiert, ohne dass vorheriges maschinelles Lernen erforderlich ist“, sagte Swami Sivasubramanian, Vizepräsident von Amazon Machine Learning. „Zusätzlich zur Integration mit anderen AWS-Diensten ermöglicht die große Community, die rund um Amazon Textract wächst, unseren Kunden, einen echten Mehrwert aus ihren Dateisammlungen zu ziehen, effizienter zu arbeiten, die Sicherheitskonformität zu verbessern, die Dateneingabe zu automatisieren und Geschäftsentscheidungen zu beschleunigen.“

Unten können Sie sich die Präsentation von Textract auf der re:Invent 2018 auf Englisch ansehen.



Source: 3dnews.ru

Kommentar hinzufügen