Amazon lancia il servizio cloud per il riconoscimento dei documenti

Hai bisogno di estrarre in modo rapido e automatico informazioni da più documenti? E vengono archiviati anche sotto forma di scansioni o fotografie? Sei fortunato se sei un cliente Amazon Web Services (AWS). Amazon ha annunciato l'apertura dell'accesso a Testo, un servizio basato su cloud e completamente gestito che utilizza l'apprendimento automatico per analizzare tabelle, moduli di testo e intere pagine di testo nei formati elettronici più diffusi. Per ora, sarà disponibile solo in regioni AWS selezionate, in particolare negli Stati Uniti orientali (Ohio e Virginia settentrionale), negli Stati Uniti occidentali (Oregon) e nell'UE (Irlanda), ma l'anno prossimo Textract sarà disponibile per tutti.

Amazon lancia il servizio cloud per il riconoscimento dei documenti

Secondo Amazon, Textract è significativamente più efficiente dei tradizionali sistemi di riconoscimento ottico dei caratteri. Dai file archiviati in un bucket Amazon S3, può estrarre il contenuto di campi e tabelle in base al contesto in cui tali informazioni vengono presentate, ad esempio evidenziando automaticamente nomi e numeri di previdenza sociale sui moduli fiscali o totali sulle ricevute fotografate. Come nota Amazon in comunicato stampa, Textract supporta formati di immagine come scansioni, PDF e fotografie e funziona in modo efficace con il contesto in documenti specifici per servizi finanziari, assicurazioni e assistenza sanitaria.

Textract archivia i risultati in formato JSON, annotati con numeri di pagina, sezioni, etichette di moduli e tipi di dati e si integra facoltativamente con servizi di database e analisi come Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena e prodotti di machine learning come Amazon Comprehend. , Amazon Comprehend Medical, Amazon Translate e Amazon SageMaker per la post-elaborazione. In alternativa, i dati estratti possono essere trasferiti direttamente a servizi cloud di terze parti per scopi di contabilità e verifica della conformità o per supportare ricerche intelligenti negli archivi documentali. Secondo Amazon, Textract può elaborare “accuratamente” milioni di pagine di documenti diversi in “solo poche ore”.

Numerosi clienti AWS utilizzano già Textract, tra cui Globe and Mail, il National Weather Service del Regno Unito, PricewaterhouseCoopers, l'organizzazione no-profit di assistenza gestita Healthfirst e le società di automazione dei processi robotici UiPath, Ripcord e Blue Prism. Candor, una startup che mira a portare trasparenza nel settore dei mutui, utilizza Textract per estrarre dati da documenti come estratti conto, buste paga e vari documenti fiscali per accelerare il processo di approvazione del prestito per i suoi clienti.

"La potenza di Amazon Textract è che estrae con precisione testo e dati strutturati praticamente da qualsiasi documento senza la necessità di un apprendimento automatico avanzato", ha affermato Swami Sivasubramanian, vicepresidente di Amazon Machine Learning. "Oltre all'integrazione con altri servizi AWS, la grande comunità che cresce attorno ad Amazon Textract consente ai nostri clienti di ottenere valore reale dalle loro raccolte di file, lavorare in modo più efficiente, migliorare la conformità alla sicurezza, automatizzare l'immissione dei dati e accelerare le decisioni aziendali."

Di seguito potete guardare la presentazione di Textract alla conferenza re:Invent 2018 in inglese.



Fonte: 3dnews.ru

Aggiungi un commento