Амазон лансира облак услуга за препознавање документи

Дали треба брзо и автоматски да извлекувате информации од повеќе документи? И дали се чуваат и во форма на скенирања или фотографии? Имате среќа ако сте клиент на веб-услугите на Amazon (AWS). Амазон најави отворање на пристап до Текст, услуга базирана на облак и целосно управувана која користи машинско учење за анализа на табели, текстуални форми и цели страници текст во популарни електронски формати. Засега, ќе биде достапен само во одредени региони на AWS, конкретно во источните САД (Охајо и Северна Вирџинија), западните САД (Орегон) и ЕУ (Ирска), но следната година Textract ќе биде достапен за сите.

Амазон лансира облак услуга за препознавање документи

Според Amazon, Textract е значително поефикасен од конвенционалните оптички системи за препознавање знаци. Од датотеките складирани во кофата на Amazon S3, може да ја извлече содржината на полињата и табелите врз основа на контекстот во кој тие информации се претставени, како што е автоматско истакнување на имиња и броеви за социјално осигурување на даночните формулари или збирки на фотографирани сметки. Како што забележува Амазон во соопштение за медиумите, Текстакт поддржува формати на слики како што се скенирања, PDF-датотеки и фотографии, и ефикасно работи со контекст во документите специфични за финансиски услуги, осигурување и здравствена заштита.

Текстрактот ги зачувува резултатите во JSON формат, означени со броеви на страници, секции, етикети на формулари и типови на податоци и опционално се интегрира со базата на податоци и услуги за аналитика како Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena и производи за машинско учење. како што се Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate и Amazon SageMaker за пост-обработка. Алтернативно, извлечените податоци може да се пренесат директно на облак-услуги на трети лица за целите на усогласеноста со сметководството и ревизијата или за поддршка на интелигентно пребарување на архивите на документи. Според Амазон, Текстракт може „прецизно“ да обработи милиони страници со различни документи за „само неколку часа“.

Бројни клиенти на AWS веќе користат Textract, вклучително и Globe and Mail, Националната метеоролошка служба на ОК, PricewaterhouseCoopers, непрофитната организација за управувана нега Healthfirst и компаниите за автоматизација на роботски процеси UiPath, Ripcord и Blue Prism. Candor, стартап кој има за цел да донесе транспарентност во хипотекарната индустрија, користи Textract за извлекување податоци од документи како што се банкарски изводи, никулци за плаќање и разни даночни документи за да го забрза процесот на одобрување заем за своите клиенти.

„Моќта на Amazon Textract е тоа што прецизно извлекува текст и структурирани податоци од буквално секој документ без потреба од напредно машинско учење“, рече Свами Сивасубраманијан, потпретседател на Amazon Machine Learning. „Покрај интеграцијата со други услуги AWS, големата заедница што расте околу Amazon Textract им овозможува на нашите клиенти да добијат вистинска вредност од нивните колекции на датотеки, да работат поефикасно, да ја подобрат безбедносната усогласеност, да го автоматизираат внесот на податоци и да ги забрзаат деловните одлуки.

Подолу можете да ја погледнете презентацијата на Textract на конференцијата re:Invent 2018 на англиски јазик.



Извор: 3dnews.ru

Додадете коментар