„Amazon“ pristato debesyje pagrįstą dokumentų atpažinimo paslaugą

Ar reikia greitai ir automatiškai išgauti informaciją iš kelių dokumentų? Ir ar jie, be to, saugomi skenuotų ar nuotraukų pavidalu? Jums pasisekė, jei esate „Amazon Web Services“ (AWS) klientas. „Amazon“ paskelbė atidariusi prieigą prie Tekstas, debesies pagrindu sukurta ir visiškai valdoma paslauga, kuri naudoja mašininį mokymąsi, kad analizuotų lenteles, teksto formas ir ištisus teksto puslapius populiariais elektroniniais formatais. Kol kas jis bus pasiekiamas tik tam tikruose AWS regionuose, ypač JAV rytuose (Ohajas ir Šiaurės Virdžinija), JAV vakaruose (Oregonas) ir ES (Airija), o „Textract“ pasirodys kitais metais.

„Amazon“ pristato debesyje pagrįstą dokumentų atpažinimo paslaugą

„Amazon“ teigimu, „Textract“ yra žymiai efektyvesnis nei įprastos optinės simbolių atpažinimo sistemos. Iš failų, saugomų „Amazon S3“ segmente, ji gali išgauti laukų ir lentelių turinį, atsižvelgdama į kontekstą, kuriame ši informacija pateikiama, pavyzdžiui, sistema automatiškai paryškina vardus ir socialinio draudimo numerius mokesčių formose arba sumas. nufotografuotų kvitų. Kaip pažymi „Amazon“. pranešimas spaudai, Textract palaiko vaizdų formatus, pvz., nuskaitymus, PDF failus ir nuotraukas, ir efektyviai dirba su kontekstu finansinių paslaugų, draudimo ir sveikatos priežiūros dokumentuose.

Textract išsaugo rezultatus JSON formatu su komentarais puslapių numeriais, skyriais, formų etiketėmis ir duomenų tipais, ir pasirinktinai integruojasi su duomenų bazėmis ir analizės paslaugomis, tokiomis kaip „Amazon Elasticsearch Service“, „Amazon DynamoDB“, „Amazon Athena“, ir mašininio mokymosi produktais, tokiais kaip „Amazon Comprehend“, „Amazon Comprehend Medical“, „Amazon Translate“ ir „Amazon SageMaker“ tolesniam apdorojimui. Arba išgauti duomenys gali būti tiesiogiai perkelti į trečiųjų šalių debesijos paslaugas apskaitos ir audito atitikties tikslais arba siekiant palaikyti išmaniąją paiešką dokumentų archyvuose. „Amazon“ teigimu, „Textract“ gali „tiksliai“ apdoroti milijonus puslapių skirtingų dokumentų per „tik kelias valandas“.

Daugelis AWS klientų jau naudojasi „Textract“, įskaitant „Globe and Mail“, JK nacionalinę orų tarnybą, „PricewaterhouseCoopers“, „Healthfirst“, ne pelno valdomą priežiūros organizaciją, ir robotų procesų automatizavimo įmones „UiPath“, „Ripcord“ ir „Blue Prism“. „Candor“, startuolis, siekiantis suteikti hipotekos sektoriui skaidrumo, naudoja „Textract“, kad išgautų duomenis iš dokumentų, tokių kaip banko ataskaitos, mokėjimo pažymos ir įvairūs mokesčių dokumentai, kad paspartintų paskolos patvirtinimo procesą savo klientams.

„Amazon Textract galia yra ta, kad ji tiksliai ištraukia tekstinius ir struktūrinius duomenis iš beveik bet kokio dokumento, nereikalaujant išankstinio mašininio mokymosi“, – sakė „Amazon Machine Learning“ viceprezidentas Swami Sivasubramanianas. „Be integracijos su kitomis AWS paslaugomis, didelė bendruomenė, auganti aplink Amazon Textract, leidžia mūsų klientams gauti realią vertę iš savo failų kolekcijų, dirbti efektyviau, pagerinti saugos atitiktį, automatizuoti duomenų įvedimą ir pagreitinti verslo sprendimų priėmimą.

Žemiau galite žiūrėti Textract pristatymą re:Invent 2018 anglų kalba.



Šaltinis: 3dnews.ru

Добавить комментарий