Amazon құжатты тану үшін бұлттық қызметті іске қосады

Бірнеше құжаттан ақпаратты жылдам және автоматты түрде алу керек пе? Және олар сканер немесе фотосуреттер түрінде де сақталады ма? Егер сіз Amazon Web Services (AWS) тұтынушысы болсаңыз, сәттілікке жетесіз. Amazon қолжетімділікті ашатынын жариялады Мәтін үзіндісі, бұлтқа негізделген және толық басқарылатын қызмет, ол кестелерді, мәтін пішіндерін және мәтіннің бүкіл беттерін танымал электрондық пішімдерде талдау үшін машиналық оқытуды пайдаланады. Әзірге ол тек таңдаулы AWS аймақтарында, атап айтқанда Шығыс АҚШ (Огайо және Солтүстік Вирджиния), Батыс АҚШ (Орегон) және ЕО (Ирландия) қол жетімді болады, бірақ келесі жылы Textract барлығына қолжетімді болады.

Amazon құжатты тану үшін бұлттық қызметті іске қосады

Amazon мәліметтері бойынша, Textract әдеттегі оптикалық таңбаларды тану жүйелеріне қарағанда айтарлықтай тиімдірек. Amazon S3 шелегінде сақталған файлдардан ол ақпарат ұсынылатын контекст негізінде өрістер мен кестелердің мазмұнын шығара алады, мысалы, салық нысандарындағы атаулар мен Әлеуметтік қамсыздандыру нөмірлерін немесе суретке түсірілген түбіртектердің қорытындыларын автоматты түрде бөлектеу. Amazon атап өткендей пресс-релиз, Texttract сканерлеу, PDF файлдары және фотосуреттер сияқты кескін пішімдерін қолдайды және қаржылық қызметтерге, сақтандыруға және денсаулық сақтауға арналған құжаттардағы мәтінмәнмен тиімді жұмыс істейді.

Texttract нәтижелерді бет нөмірлерімен, бөлімдерімен, пішін белгілерімен және деректер түрлерімен түсіндірілетін JSON пішімінде сақтайды және қосымша түрде Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena сияқты дерекқор және талдау қызметтерімен және Amazon Comprehend сияқты машиналық оқыту өнімдерімен біріктіріледі. , Amazon Comprehend Medical, Amazon Translate және Amazon SageMaker кейінгі өңдеуге арналған. Балама түрде, алынған деректерді есепке алу және сәйкестік аудиті мақсатында немесе құжат мұрағаттарын интеллектуалды іздеуді қолдау үшін тікелей үшінші тарап бұлттық қызметтеріне жіберуге болады. Amazon мәліметтері бойынша, Textract миллиондаған түрлі құжаттарды «бірнеше сағатта» «дәл» өңдей алады.

Көптеген AWS тұтынушылары Globe and Mail, Ұлыбританияның Ұлттық ауа райы қызметі, PricewaterhouseCoopers, Healthfirst коммерциялық емес басқарылатын күтім ұйымы және UiPath, Ripcord және Blue Prism роботтық процестерді автоматтандыру компанияларын қоса алғанда, Textract қолданбасын пайдаланады. Ипотекалық салаға ашықтық әкелуді мақсат еткен Candor стартап өз клиенттері үшін несиені мақұлдау процесін жылдамдату үшін банк үзінділері, төлем түбіртектері және әртүрлі салық құжаттары сияқты құжаттардан деректерді алу үшін Textract пайдаланады.

Amazon Machine Learning вице-президенті Свами Сивасубраманиан: «Amazon Textract-тың күші - ол кез келген құжаттан мәтінді және құрылымдық деректерді кеңейтілген машиналық оқытуды қажет етпей дәл шығарады», - деді. «Басқа AWS қызметтерімен интеграциядан басқа, Amazon Textract айналасында өсіп келе жатқан үлкен қауымдастық біздің тұтынушыларымызға файлдар жинақтарынан нақты құнды алуға, тиімдірек жұмыс істеуге, қауіпсіздік талаптарын сақтауды жақсартуға, деректерді енгізуді автоматтандыруға және бизнес шешімдерін қабылдауды жеделдетуге мүмкіндік береді.»

Төменде ағылшын тілінде re:Invent 2018 конференциясында Textract презентациясын көре аласыз.



Ақпарат көзі: 3dnews.ru

пікір қалдыру