Amazon-ը գործարկում է փաստաթղթերի ճանաչման ամպային ծառայություն

Ձեզ անհրաժեշտ է արագ և ավտոմատ կերպով տեղեկատվություն հանել բազմաթիվ փաստաթղթերից: Իսկ դրանք նաև պահվու՞մ են սքաների կամ լուսանկարների տեսքով։ Դուք հաջողակ եք, եթե դուք Amazon Web Services (AWS) հաճախորդ եք: Amazon-ը հայտարարել է մուտքի բացման մասին Տեքստը, ամպի վրա հիմնված և ամբողջությամբ կառավարվող ծառայություն, որն օգտագործում է մեքենայական ուսուցում՝ վերլուծելու աղյուսակները, տեքստային ձևերը և տեքստի ամբողջ էջերը հանրաճանաչ էլեկտրոնային ձևաչափերով։ Առայժմ այն ​​հասանելի կլինի միայն AWS-ի ընտրված տարածաշրջաններում, մասնավորապես՝ Արևելյան ԱՄՆ-ում (Օհայո և Հյուսիսային Վիրջինիա), Արևմտյան ԱՄՆ-ում (Օրեգոն) և ԵՄ-ում (Իռլանդիա), սակայն հաջորդ տարի Texttract-ը հասանելի կլինի բոլորին:

Amazon-ը գործարկում է փաստաթղթերի ճանաչման ամպային ծառայություն

Ըստ Amazon-ի՝ Texttract-ը զգալիորեն ավելի արդյունավետ է, քան սովորական օպտիկական նիշերի ճանաչման համակարգերը: Amazon S3 դույլում պահված ֆայլերից այն կարող է հանել դաշտերի և աղյուսակների բովանդակությունը՝ հիմնվելով այդ տեղեկատվության ներկայացման համատեքստի վրա, օրինակ՝ ինքնաբերաբար նշելով անունները և սոցիալական ապահովության համարները հարկային ձևաթղթերում կամ գումարները լուսանկարված անդորրագրերի վրա: Ինչպես նշում է Amazon-ը մամլո հաղորդագրություն, Texttract-ն աջակցում է պատկերների ձևաչափերին, ինչպիսիք են սկանավորումները, PDF-ները և լուսանկարները, և արդյունավետորեն աշխատում է համատեքստի հետ ֆինանսական ծառայությունների, ապահովագրության և առողջության պահպանման համար հատուկ փաստաթղթերում:

Տեքստը պահպանում է արդյունքները JSON ձևաչափով, ծանոթագրված էջի համարներով, բաժիններով, ձևի պիտակներով և տվյալների տեսակներով և ընտրովի ինտեգրվում է տվյալների բազայի և վերլուծական ծառայությունների հետ, ինչպիսիք են Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena և մեքենայական ուսուցման արտադրանքները, ինչպիսիք են Amazon Comprehend-ը: , Amazon Comprehend Medical, Amazon Translate և Amazon SageMaker հետմշակման համար: Որպես այլընտրանք, արդյունահանված տվյալները կարող են ուղղակիորեն փոխանցվել երրորդ կողմի ամպային ծառայություններին՝ հաշվապահական հաշվառման և աուդիտի համապատասխանության նպատակներով կամ փաստաթղթերի արխիվներում խելացի որոնումներին աջակցելու համար: Ըստ Amazon-ի՝ Texttract-ը կարող է «ճշգրիտ» մշակել տարբեր փաստաթղթերի միլիոնավոր էջեր «ընդամենը մի քանի ժամում»։

AWS-ի բազմաթիվ հաճախորդներ արդեն օգտագործում են Texttract-ը, այդ թվում՝ Globe and Mail-ը, Մեծ Բրիտանիայի Եղանակի Ազգային Ծառայությունը, PricewaterhouseCoopers-ը, ոչ առևտրային կառավարվող խնամքի կազմակերպությունը Healthfirst-ը և ռոբոտային գործընթացների ավտոմատացման UiPath, Ripcord և Blue Prism ընկերությունները: Candor-ը, ստարտափը, որի նպատակն է թափանցիկություն հաղորդել հիփոթեքային արդյունաբերությանը, օգտագործում է Texttract-ը տվյալներ քաղելու համար այնպիսի փաստաթղթերից, ինչպիսիք են բանկային քաղվածքները, վճարման անդորրագրերը և հարկային տարբեր փաստաթղթեր՝ իր հաճախորդների համար վարկի հաստատման գործընթացը արագացնելու համար:

«Amazon Texttract-ի հզորությունն այն է, որ այն ճշգրիտ կերպով քաղում է տեքստ և կառուցվածքային տվյալներ գրեթե ցանկացած փաստաթղթից՝ առանց առաջադեմ մեքենայական ուսուցման անհրաժեշտության», - ասում է Amazon Machine Learning-ի փոխնախագահ Սվամի Սիվասուբրամանյանը: «Այլ AWS ծառայությունների հետ ինտեգրումից բացի, Amazon Textract-ի շուրջ աճող մեծ համայնքը մեր հաճախորդներին թույլ է տալիս իրական արժեք ձեռք բերել իրենց ֆայլերի հավաքածուներից, աշխատել ավելի արդյունավետ, բարելավել անվտանգության համապատասխանությունը, ավտոմատացնել տվյալների մուտքագրումը և արագացնել բիզնես որոշումները»:

Ստորև կարող եք դիտել Textract-ի շնորհանդեսը re:Invent 2018 կոնֆերանսում անգլերենով։



Source: 3dnews.ru

Добавить комментарий