Ar reikia greitai ir automatiškai išgauti informaciją iš kelių dokumentų? Ir ar jie, be to, saugomi skenuotų ar nuotraukų pavidalu? Jums pasisekė, jei esate „Amazon Web Services“ (AWS) klientas. „Amazon“ paskelbė atidariusi prieigą prie
„Amazon“ teigimu, „Textract“ yra žymiai efektyvesnis nei įprastos optinės simbolių atpažinimo sistemos. Iš failų, saugomų „Amazon S3“ segmente, ji gali išgauti laukų ir lentelių turinį, atsižvelgdama į kontekstą, kuriame ši informacija pateikiama, pavyzdžiui, sistema automatiškai paryškina vardus ir socialinio draudimo numerius mokesčių formose arba sumas. nufotografuotų kvitų. Kaip pažymi „Amazon“.
Textract išsaugo rezultatus JSON formatu su komentarais puslapių numeriais, skyriais, formų etiketėmis ir duomenų tipais, ir pasirinktinai integruojasi su duomenų bazėmis ir analizės paslaugomis, tokiomis kaip „Amazon Elasticsearch Service“, „Amazon DynamoDB“, „Amazon Athena“, ir mašininio mokymosi produktais, tokiais kaip „Amazon Comprehend“, „Amazon Comprehend Medical“, „Amazon Translate“ ir „Amazon SageMaker“ tolesniam apdorojimui. Arba išgauti duomenys gali būti tiesiogiai perkelti į trečiųjų šalių debesijos paslaugas apskaitos ir audito atitikties tikslais arba siekiant palaikyti išmaniąją paiešką dokumentų archyvuose. „Amazon“ teigimu, „Textract“ gali „tiksliai“ apdoroti milijonus puslapių skirtingų dokumentų per „tik kelias valandas“.
Daugelis AWS klientų jau naudojasi „Textract“, įskaitant „Globe and Mail“, JK nacionalinę orų tarnybą, „PricewaterhouseCoopers“, „Healthfirst“, ne pelno valdomą priežiūros organizaciją, ir robotų procesų automatizavimo įmones „UiPath“, „Ripcord“ ir „Blue Prism“. „Candor“, startuolis, siekiantis suteikti hipotekos sektoriui skaidrumo, naudoja „Textract“, kad išgautų duomenis iš dokumentų, tokių kaip banko ataskaitos, mokėjimo pažymos ir įvairūs mokesčių dokumentai, kad paspartintų paskolos patvirtinimo procesą savo klientams.
„Amazon Textract galia yra ta, kad ji tiksliai ištraukia tekstinius ir struktūrinius duomenis iš beveik bet kokio dokumento, nereikalaujant išankstinio mašininio mokymosi“, – sakė „Amazon Machine Learning“ viceprezidentas Swami Sivasubramanianas. „Be integracijos su kitomis AWS paslaugomis, didelė bendruomenė, auganti aplink Amazon Textract, leidžia mūsų klientams gauti realią vertę iš savo failų kolekcijų, dirbti efektyviau, pagerinti saugos atitiktį, automatizuoti duomenų įvedimą ir pagreitinti verslo sprendimų priėmimą.
Žemiau galite žiūrėti Textract pristatymą re:Invent 2018 anglų kalba.
Šaltinis: 3dnews.ru