Amazon llança un servei de reconeixement de documents basat en núvol

Necessites extreure informació ràpida i automàtica de diversos documents? I, a més, s'emmagatzemen en forma d'escaneigs o fotografies? Estàs de sort si ets client d'Amazon Web Services (AWS). Amazon va anunciar l'obertura de l'accés a Text, un servei basat en núvol i totalment gestionat que utilitza l'aprenentatge automàtic per analitzar taules, formularis de text i pàgines senceres de text en formats electrònics populars. De moment, només estarà disponible a algunes regions d'AWS, concretament a l'est dels Estats Units (Ohio i Virgínia del nord), l'oest dels EUA (Oregon) i la UE (Irlanda), i Texttract sortirà a borsa l'any vinent.

Amazon llança un servei de reconeixement de documents basat en núvol

Segons Amazon, Texttract és significativament més eficient que els sistemes de reconeixement òptic de caràcters convencionals. A partir d'arxius emmagatzemats en un bucket d'Amazon S3, pot extreure el contingut de camps i taules, tenint en compte el context en què es presenta aquesta informació, per exemple, el sistema destaca automàticament els noms i números de seguretat social als formularis fiscals o els totals. de rebuts fotografiats. Tal com assenyala Amazon nota de premsa, Texttract admet formats d'imatge com ara escanejos, PDF i fotos, i funciona de manera eficient amb el context en documents específics de serveis financers, assegurances i assistència sanitària.

Texttract desa els resultats en format JSON anotats amb números de pàgina, seccions, etiquetes de formulari i tipus de dades, i opcionalment s'integra amb serveis d'anàlisi i bases de dades com Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena i productes d'aprenentatge automàtic, com Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate i Amazon SageMaker per al postprocessament. Alternativament, les dades extretes es poden transferir directament a serveis al núvol de tercers amb finalitats de compliment de comptabilitat i auditoria o per donar suport a cerques intel·ligents als arxius de documents. Segons Amazon, Texttract pot processar "de manera precisa" milions de pàgines de documents diferents en "poques hores".

Molts clients d'AWS ja utilitzen Textract, com Globe and Mail, el Servei Meteorològic Nacional del Regne Unit, PricewaterhouseCoopers, Healthfirst, una organització d'atenció gestionada sense ànim de lucre i les empreses d'automatització de processos robòtics UiPath, Ripcord i Blue Prism. Candor, una startup que pretén aportar transparència al sector hipotecari, utilitza Textextract per extreure dades de documents com extractes bancaris, talons de pagament i diversos documents fiscals per accelerar el procés d'aprovació de préstecs dels seus clients.

"El poder d'Amazon Texttract és que extreu amb precisió dades textuals i estructurades de pràcticament qualsevol document sense necessitat d'aprenentatge automàtic previ", va dir Swami Sivasubramanian, vicepresident d'Amazon Machine Learning. "A més d'integrar-se amb altres serveis d'AWS, la gran comunitat que creix al voltant d'Amazon Textract permet als nostres clients treure un valor real de les seves col·leccions de fitxers, treballar de manera més eficient, millorar el compliment de seguretat, automatitzar l'entrada de dades i accelerar les decisions empresarials".

A continuació podeu veure la presentació de Texttract a re:Invent 2018 en anglès.



Font: 3dnews.ru

Afegeix comentari