Amazon hujjatni tanib olish uchun bulut xizmatini ishga tushirdi

Bir nechta hujjatlardan ma'lumotlarni tez va avtomatik ravishda ajratib olishingiz kerakmi? Va ular skanerlash yoki fotosuratlar shaklida ham saqlanadimi? Agar siz Amazon Web Services (AWS) mijozi bo'lsangiz, omadingiz bor. Amazon kirishning ochilishini e'lon qildi Matn ekstrakti, mashhur elektron formatlarda jadvallar, matn shakllari va matnning butun sahifalarini tahlil qilish uchun mashinani o'rganishdan foydalanadigan bulutga asoslangan va to'liq boshqariladigan xizmat. Hozircha u faqat tanlangan AWS mintaqalarida, xususan, Sharqiy AQSh (Ogayo va Shimoliy Virjiniya), Gʻarbiy AQSh (Oregon) va Yevropa Ittifoqida (Irlandiya) mavjud boʻladi, ammo kelgusi yilda Textract hamma uchun mavjud boʻladi.

Amazon hujjatni tanib olish uchun bulut xizmatini ishga tushirdi

Amazon ma'lumotlariga ko'ra, Textract an'anaviy optik belgilarni aniqlash tizimlariga qaraganda ancha samarali. Amazon S3 paqirida saqlangan fayllardan ushbu ma'lumotlar taqdim etilgan kontekstga asoslangan maydonlar va jadvallar mazmunini ajratib olishi mumkin, masalan, soliq shakllarida ismlar va ijtimoiy sug'urta raqamlarini yoki suratga olingan kvitansiyalarning umumiy miqdorini avtomatik ravishda ajratib ko'rsatish. Amazon qayd etganidek press-reliz, Textract skanerlash, PDF va fotosuratlar kabi tasvir formatlarini qo'llab-quvvatlaydi va moliyaviy xizmatlar, sug'urta va sog'liqni saqlashga oid hujjatlardagi kontekst bilan samarali ishlaydi.

Texttract natijalarni sahifa raqamlari, boʻlimlari, shakl yorliqlari va maʼlumotlar turlari bilan izohlangan JSON formatida saqlaydi va ixtiyoriy ravishda Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena va Amazon Comprehend kabi mashina oʻrganish mahsulotlari kabi maʼlumotlar bazasi va tahlil xizmatlari bilan integratsiyalanadi. , Amazon Comprehend Medical, Amazon Translate va Amazon SageMaker post-qayta ishlash uchun. Shu bilan bir qatorda, olingan ma'lumotlar to'g'ridan-to'g'ri uchinchi tomon bulut xizmatlariga buxgalteriya hisobi va muvofiqlik auditi maqsadlarida yoki hujjatlar arxivlarini aqlli qidirishni qo'llab-quvvatlash uchun uzatilishi mumkin. Amazon ma'lumotlariga ko'ra, Textract millionlab sahifali turli xil hujjatlarni "bir necha soat" ichida "aniq" qayta ishlay oladi.

Ko'pgina AWS mijozlari allaqachon Globe and Mail, Buyuk Britaniyaning Milliy ob-havo xizmati, PricewaterhouseCoopers, Healthfirst notijorat boshqariladigan parvarishlash tashkiloti va robotlashtirilgan jarayonlarni avtomatlashtirish kompaniyalari UiPath, Ripcord va Blue Prism kabi Textract-dan foydalanishadi. Ipoteka sohasida shaffoflikni ta'minlashni maqsad qilgan startap Candor o'z mijozlari uchun kreditni tasdiqlash jarayonini tezlashtirish uchun Textract'dan bank ko'chirmalari, to'lovlar va turli soliq hujjatlari kabi hujjatlardan ma'lumotlarni olish uchun foydalanadi.

Amazon Machine Learning vitse-prezidenti Svami Sivasubramanian, "Amazon Textract-ning kuchi shundaki, u matn va tuzilgan ma'lumotlarni deyarli har qanday hujjatdan mashinani ilg'or o'rganishni talab qilmasdan aniq ajratib oladi". "Boshqa AWS xizmatlari bilan integratsiyadan tashqari, Amazon Textract atrofida o'sib borayotgan katta hamjamiyat mijozlarimizga o'zlarining fayllar to'plamidan haqiqiy qiymatga ega bo'lishlari, yanada samarali ishlashlari, xavfsizlik talablariga muvofiqligini yaxshilashlari, ma'lumotlarni kiritishni avtomatlashtirishlari va biznes qarorlarini tezlashtirishlari mumkin."

Quyida Re:Invent 2018 konferensiyasidagi Textract taqdimotini ingliz tilida tomosha qilishingiz mumkin.



Manba: 3dnews.ru

a Izoh qo'shish