Дали треба брзо и автоматски да извлекувате информации од повеќе документи? И дали се чуваат и во форма на скенирања или фотографии? Имате среќа ако сте клиент на веб-услугите на Amazon (AWS). Амазон најави отворање на пристап до
Според Amazon, Textract е значително поефикасен од конвенционалните оптички системи за препознавање знаци. Од датотеките складирани во кофата на Amazon S3, може да ја извлече содржината на полињата и табелите врз основа на контекстот во кој тие информации се претставени, како што е автоматско истакнување на имиња и броеви за социјално осигурување на даночните формулари или збирки на фотографирани сметки. Како што забележува Амазон во
Текстрактот ги зачувува резултатите во JSON формат, означени со броеви на страници, секции, етикети на формулари и типови на податоци и опционално се интегрира со базата на податоци и услуги за аналитика како Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena и производи за машинско учење. како што се Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate и Amazon SageMaker за пост-обработка. Алтернативно, извлечените податоци може да се пренесат директно на облак-услуги на трети лица за целите на усогласеноста со сметководството и ревизијата или за поддршка на интелигентно пребарување на архивите на документи. Според Амазон, Текстракт може „прецизно“ да обработи милиони страници со различни документи за „само неколку часа“.
Бројни клиенти на AWS веќе користат Textract, вклучително и Globe and Mail, Националната метеоролошка служба на ОК, PricewaterhouseCoopers, непрофитната организација за управувана нега Healthfirst и компаниите за автоматизација на роботски процеси UiPath, Ripcord и Blue Prism. Candor, стартап кој има за цел да донесе транспарентност во хипотекарната индустрија, користи Textract за извлекување податоци од документи како што се банкарски изводи, никулци за плаќање и разни даночни документи за да го забрза процесот на одобрување заем за своите клиенти.
„Моќта на Amazon Textract е тоа што прецизно извлекува текст и структурирани податоци од буквално секој документ без потреба од напредно машинско учење“, рече Свами Сивасубраманијан, потпретседател на Amazon Machine Learning. „Покрај интеграцијата со други услуги AWS, големата заедница што расте околу Amazon Textract им овозможува на нашите клиенти да добијат вистинска вредност од нивните колекции на датотеки, да работат поефикасно, да ја подобрат безбедносната усогласеност, да го автоматизираат внесот на податоци и да ги забрзаат деловните одлуки.
Подолу можете да ја погледнете презентацијата на Textract на конференцијата re:Invent 2018 на англиски јазик.
Извор: 3dnews.ru