Gilunsad sa Amazon ang serbisyo sa pag-ila sa dokumento nga nakabase sa panganod

Kinahanglan ba nimo nga dali ug awtomatiko nga makuha ang kasayuran gikan sa daghang mga dokumento? Ug sila ba, dugang pa, gitipigan sa porma sa mga pag-scan o mga litrato? Swerte ka kung ikaw usa ka kustomer sa Amazon Web Services (AWS). Gipahibalo sa Amazon ang pag-abli sa pag-access sa Teksto, usa ka cloud-based ug fully managed nga serbisyo nga naggamit sa machine learning sa pag-analisar sa mga table, text forms, ug tibuok panid sa text sa sikat nga electronic format. Sa pagkakaron, magamit ra kini sa pinili nga mga rehiyon sa AWS, ilabi na sa US East (Ohio ug Northern Virginia), US West (Oregon), ug EU (Ireland), uban ang Texttract nga mahimong publiko sa sunod tuig.

Gilunsad sa Amazon ang serbisyo sa pag-ila sa dokumento nga nakabase sa panganod

Sumala sa Amazon, ang Texttract mas episyente kay sa naandan nga optical character recognition system. Gikan sa mga file nga gitipigan sa usa ka balde sa Amazon S3, mahimo’g makuha ang mga sulud sa mga uma ug mga lamesa, nga gikonsiderar ang konteksto diin kini nga kasayuran gipresentar, pananglitan, ang sistema awtomatiko nga nagpasiugda sa mga ngalan ug mga numero sa seguridad sa sosyal sa mga porma sa buhis o ang mga kinatibuk-an. sa mga litrato nga resibo. Sama sa giingon sa Amazon sa press release, Gisuportahan sa Text ang mga format sa imahe sama sa mga scan, PDF, ug mga litrato, ug epektibo nga nagtrabaho sa konteksto sa mga dokumento nga espesipiko sa serbisyo sa pinansyal, insurance, ug pag-atiman sa panglawas.

Gitipigan sa teksto ang mga resulta sa JSON nga format nga gi-annotate sa mga numero sa panid, mga seksyon, mga label sa porma, ug mga tipo sa datos, ug opsyonal nga gihiusa sa mga serbisyo sa database ug analytics sama sa Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, ug mga produkto sa pagkat-on sa makina, sama sa Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate, ug Amazon SageMaker alang sa post-processing. Sa laing bahin, ang nakuha nga datos mahimong direktang ibalhin ngadto sa mga third party cloud services alang sa accounting ug auditing compliance purposes o aron pagsuporta sa mga smart searches sa document archives. Sumala sa Amazon, ang Texttract mahimong "tukma" nga magproseso sa milyon-milyon nga mga panid sa lainlaing mga dokumento sa "pipila lang ka oras."

Daghang mga kostumer sa AWS ang naggamit na sa Texttract, lakip ang Globe ug Mail, ang UK National Weather Service, PricewaterhouseCoopers, Healthfirst, usa ka non-profit nga pagdumala nga organisasyon sa pag-atiman, ug mga kompanya sa robotic nga proseso sa automation nga UiPath, Ripcord, ug Blue Prism. Ang Candor, usa ka startup nga nagtumong sa pagdala sa transparency sa industriya sa mortgage, naggamit sa Texttract aron makuha ang mga datos gikan sa mga dokumento sama sa mga bank statement, pay stubs ug lain-laing mga dokumento sa buhis aron mapadali ang proseso sa pag-apruba sa pautang alang sa mga kliyente niini.

"Ang gahum sa Amazon Text mao ang tukma nga pagkuha sa teksto ug istruktura nga datos gikan sa halos bisan unsang dokumento nga wala kinahanglana ang una nga pagkat-on sa makina," ingon si Swami Sivasubramanian, bise presidente sa Amazon Machine Learning. "Dugang pa sa paghiusa sa ubang mga serbisyo sa AWS, ang dako nga komunidad nga nagtubo sa palibot sa Amazon Text nagtugot sa among mga kustomer nga makakuha og tinuod nga kantidad gikan sa ilang mga koleksyon sa file, magtrabaho nga mas episyente, mapaayo ang pagsunod sa seguridad, awtomatiko ang pagsulod sa datos, ug mapadali ang mga desisyon sa negosyo."

Sa ubos mahimo nimong tan-awon ang presentasyon sa Texttract sa re:Invent 2018 sa English.



Source: 3dnews.ru

Idugang sa usa ka comment