Η Amazon εγκαινιάζει την υπηρεσία αναγνώρισης εγγράφων που βασίζεται σε σύννεφο

Χρειάζεται να εξάγετε γρήγορα και αυτόματα πληροφορίες από πολλά έγγραφα; Και, επιπλέον, αποθηκεύονται με τη μορφή σαρώσεων ή φωτογραφιών; Είστε τυχεροί εάν είστε πελάτης των Υπηρεσιών Ιστού της Amazon (AWS). Η Amazon ανακοίνωσε το άνοιγμα της πρόσβασης σε Κείμενο, μια υπηρεσία που βασίζεται σε σύννεφο και πλήρως διαχειριζόμενη υπηρεσία που χρησιμοποιεί μηχανική εκμάθηση για να αναλύει πίνακες, φόρμες κειμένου και ολόκληρες σελίδες κειμένου σε δημοφιλείς ηλεκτρονικές μορφές. Προς το παρόν, θα είναι διαθέσιμο μόνο σε επιλεγμένες περιοχές AWS, συγκεκριμένα στις Ανατολικές ΗΠΑ (Οχάιο και Βόρεια Βιρτζίνια), στη Δύση των ΗΠΑ (Όρεγκον) και στην ΕΕ (Ιρλανδία), με το Textract να είναι διαθέσιμο το επόμενο έτος.

Η Amazon εγκαινιάζει την υπηρεσία αναγνώρισης εγγράφων που βασίζεται σε σύννεφο

Σύμφωνα με την Amazon, το Texttract είναι σημαντικά πιο αποτελεσματικό από τα συμβατικά συστήματα οπτικής αναγνώρισης χαρακτήρων. Από αρχεία που είναι αποθηκευμένα σε κάδο Amazon S3, μπορεί να εξαγάγει τα περιεχόμενα των πεδίων και των πινάκων, λαμβάνοντας υπόψη το πλαίσιο στο οποίο παρουσιάζονται αυτές οι πληροφορίες, για παράδειγμα, το σύστημα επισημαίνει αυτόματα τα ονόματα και τους αριθμούς κοινωνικής ασφάλισης στα φορολογικά έντυπα ή τα σύνολα φωτογραφικών αποδείξεων. Όπως σημειώνει η Amazon δελτίο τύπου, Το Texttract υποστηρίζει μορφές εικόνας όπως σαρώσεις, αρχεία PDF και φωτογραφίες και λειτουργεί αποτελεσματικά με το πλαίσιο σε έγγραφα ειδικά για χρηματοοικονομικές υπηρεσίες, ασφάλειες και υγειονομική περίθαλψη.

Το κείμενο αποθηκεύει αποτελέσματα σε μορφή JSON με σχολιασμούς αριθμούς σελίδων, ενότητες, ετικέτες φόρμας και τύπους δεδομένων και προαιρετικά ενσωματώνεται με υπηρεσίες βάσης δεδομένων και αναλυτικών στοιχείων όπως Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena και προϊόντα μηχανικής εκμάθησης, όπως το Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate και Amazon SageMaker για μετα-επεξεργασία. Εναλλακτικά, τα εξαγόμενα δεδομένα μπορούν να μεταφερθούν απευθείας σε υπηρεσίες cloud τρίτων για σκοπούς λογιστικής και ελέγχου συμμόρφωσης ή για υποστήριξη έξυπνων αναζητήσεων σε αρχεία εγγράφων. Σύμφωνα με την Amazon, το Texttract μπορεί να επεξεργαστεί «με ακρίβεια» εκατομμύρια σελίδες διαφορετικών εγγράφων σε «λίγες μόνο ώρες».

Πολλοί πελάτες AWS χρησιμοποιούν ήδη το Texttract, συμπεριλαμβανομένων των Globe and Mail, της Εθνικής Μετεωρολογικής Υπηρεσίας του Ηνωμένου Βασιλείου, της PricewaterhouseCoopers, της Healthfirst, ενός μη κερδοσκοπικού οργανισμού διαχείρισης φροντίδας και των εταιρειών αυτοματισμού ρομποτικών διαδικασιών UiPath, Ripcord και Blue Prism. Η Candor, μια startup που στοχεύει να φέρει διαφάνεια στον κλάδο των στεγαστικών δανείων, χρησιμοποιεί το Textract για να εξάγει δεδομένα από έγγραφα όπως τραπεζικές καταστάσεις, αποκόμματα και διάφορα φορολογικά έγγραφα για να επιταχύνει τη διαδικασία έγκρισης δανείου για τους πελάτες της.

«Η δύναμη του Amazon Textract είναι ότι εξάγει με ακρίβεια κειμενικά και δομημένα δεδομένα από σχεδόν οποιοδήποτε έγγραφο χωρίς την ανάγκη προηγούμενης μηχανικής εκμάθησης», δήλωσε ο Swami Sivasubramanian, αντιπρόεδρος της Amazon Machine Learning. "Εκτός από την ενσωμάτωση με άλλες υπηρεσίες AWS, η μεγάλη κοινότητα που αναπτύσσεται γύρω από το Amazon Textract επιτρέπει στους πελάτες μας να αντλούν πραγματική αξία από τις συλλογές αρχείων τους, να εργάζονται πιο αποτελεσματικά, να βελτιώνουν τη συμμόρφωση με την ασφάλεια, να αυτοματοποιούν την εισαγωγή δεδομένων και να επιταχύνουν τις επιχειρηματικές αποφάσεις."

Παρακάτω μπορείτε να παρακολουθήσετε την παρουσίαση του Textract στο re:Invent 2018 στα αγγλικά.



Πηγή: 3dnews.ru

Προσθέστε ένα σχόλιο