Amazon-ek hodeian oinarritutako dokumentuak ezagutzeko zerbitzua abiarazten du

Dokumentu anitzetatik informazioa azkar eta automatikoki atera behar al duzu? Eta, gainera, eskaneatu edo argazki moduan gordetzen dira? Zorte ona duzu Amazon Web Services (AWS) bezeroa bazara. Amazonek sarbidea ireki zuela iragarri zuen Testua, hodeian oinarritutako eta guztiz kudeatutako zerbitzu bat, ikaskuntza automatikoa erabiltzen duena, formatu elektroniko ezagunetan taulak, testu-inprimakiak eta testu-orri osoak aztertzeko. Oraingoz, AWS eskualde batzuetan soilik egongo da eskuragarri, zehazki AEBetako Ekialdean (Ohio eta Ipar Virginia), AEBetako Mendebaldean (Oregon) eta EBn (Irlanda), hurrengo urtean Textract merkaturatuko baita.

Amazon-ek hodeian oinarritutako dokumentuak ezagutzeko zerbitzua abiarazten du

Amazonen arabera, Texttract karaktereak ezagutzeko ohiko sistema optikoek baino askoz eraginkorragoa da. Amazon S3 ontzi batean gordetako fitxategietatik, eremuen eta taulen edukia atera dezake, informazio hori aurkezten den testuingurua kontuan hartuta, adibidez, sistemak automatikoki nabarmentzen ditu zerga-inprimakietako izenak eta gizarte segurantzako zenbakiak edo guztirakoak. argazkien ordainagirien. Amazonek ohartarazi duenez Prentsa-oharra, Texttract-ek irudi formatuak onartzen ditu, hala nola, eskaneatzea, PDFak eta argazkiak, eta modu eraginkorrean lan egiten du testuinguruarekin finantza-zerbitzuei, aseguruei eta osasun-laguntzari buruzko dokumentu espezifikoetan.

Texttract-ek emaitzak JSON formatuan gordetzen ditu orrialde-zenbakiekin, atalekin, inprimaki-etiketekin eta datu-motekin ohartarazita, eta, aukeran, datu-base eta analisi-zerbitzuekin integratzen da, hala nola Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena eta ikaskuntza automatikoko produktuekin, hala nola Amazon Comprehend. Amazon Comprehend Medical, Amazon Translate eta Amazon SageMaker postprozesatzeko. Bestela, ateratako datuak zuzenean hirugarrenen hodeiko zerbitzuetara transferi daitezke, kontabilitate- eta auditoretza-betetze-helburuetarako edo dokumentu-artxiboetan bilaketa adimentsuak laguntzeko. Amazonen arabera, Texttractek "zehaztasunez" prozesatu ditzake dokumentu ezberdinen milioika orrialde "ordu gutxitan".

AWSko bezero askok dagoeneko erabiltzen dute Textract, besteak beste, Globe and Mail, Erresuma Batuko Eguraldi Zerbitzu Nazionala, PricewaterhouseCoopers, Healthfirst, irabazi-asmorik gabeko laguntza kudeatutako erakunde bat eta prozesu robotikoen automatizazioko UiPath, Ripcord eta Blue Prism enpresak. Candor-ek, hipoteken industriari gardentasuna ekartzea helburu duen startup-ak, Texttract erabiltzen du dokumentuetatik datuak ateratzeko, hala nola, banku-adierazpenak, ordainagiriak eta hainbat zerga-dokumentu bere bezeroen maileguak onartzeko prozesua azkartzeko.

"Amazon Texttract-en boterea ia edozein dokumentutatik testu- eta egituratutako datuak zehaztasunez ateratzen dituela da, aldez aurretiko ikaskuntza automatikoaren beharrik gabe", esan zuen Swami Sivasubramanian-ek, Amazon Machine Learning-eko presidenteordeak. "AWSko beste zerbitzu batzuekin integratzeaz gain, Amazon Textract inguruan hazten den komunitate handiak gure bezeroei beren fitxategi-bildumei benetako balioa ateratzea ahalbidetzen die, modu eraginkorragoan lan egin, segurtasun-betetzea hobetzea, datuak automatizatzea eta negozio-erabakiak bizkortzea".

Jarraian, Texttract-en aurkezpena ikusi dezakezu re:Invent 2018 ingelesez.



Iturria: 3dnews.ru

Gehitu iruzkin berria