أطلقت أمازون خدمة التعرف على المستندات المستندة إلى السحابة

هل تحتاج إلى استخراج المعلومات بسرعة وتلقائية من مستندات متعددة؟ وهل هي ، علاوة على ذلك ، مخزنة في شكل مسح ضوئي أو صور فوتوغرافية؟ أنت محظوظ إذا كنت أحد عملاء Amazon Web Services (AWS). أعلنت أمازون فتح الوصول إلى نص، وهي خدمة قائمة على السحابة ومدارة بالكامل تستخدم التعلم الآلي لتحليل الجداول والنماذج النصية وصفحات كاملة من النص بتنسيقات إلكترونية شائعة. في الوقت الحالي ، سيكون متاحًا فقط في مناطق AWS محددة ، وتحديداً شرق الولايات المتحدة (أوهايو وشمال فيرجينيا) ، وغرب الولايات المتحدة (أوريغون) ، والاتحاد الأوروبي (أيرلندا) ، مع طرح Textract للجمهور العام المقبل.

أطلقت أمازون خدمة التعرف على المستندات المستندة إلى السحابة

وفقًا لـ Amazon ، يعد Textract أكثر كفاءة بشكل ملحوظ من أنظمة التعرف على الأحرف البصرية التقليدية. من الملفات المخزنة في حاوية Amazon S3 ، يمكنه استخراج محتويات الحقول والجداول ، مع مراعاة السياق الذي يتم تقديم هذه المعلومات فيه ، على سبيل المثال ، يقوم النظام تلقائيًا بتمييز الأسماء وأرقام الضمان الاجتماعي في نماذج الضرائب أو الإجماليات من الإيصالات المصورة. كما تلاحظ أمازون في خبر صحفى، يدعم Textract تنسيقات الصور مثل عمليات المسح وملفات PDF والصور ، ويعمل بكفاءة مع السياق في المستندات الخاصة بالخدمات المالية والتأمين والرعاية الصحية.

يحفظ Textract النتائج بتنسيق JSON مع تعليقات توضيحية بأرقام الصفحات والأقسام وتسميات النماذج وأنواع البيانات ، ويتكامل اختياريًا مع خدمات قواعد البيانات والتحليلات مثل Amazon Elasticsearch Service و Amazon DynamoDB و Amazon Athena ومنتجات التعلم الآلي ، مثل Amazon Comprehend ، Amazon Comprehend Medical و Amazon Translate و Amazon SageMaker للمعالجة اللاحقة. بدلاً من ذلك ، يمكن نقل البيانات المستخرجة مباشرةً إلى الخدمات السحابية لجهات خارجية لأغراض الامتثال للمحاسبة والتدقيق أو لدعم عمليات البحث الذكية في أرشيفات المستندات. وفقًا لأمازون ، يمكن لـ Textract معالجة ملايين الصفحات من المستندات المختلفة "بدقة" في "ساعات قليلة فقط".

يستخدم العديد من عملاء AWS بالفعل Textract ، بما في ذلك Globe and Mail و UK National Weather Service و PricewaterhouseCoopers و Healthfirst وهي منظمة رعاية مدارة غير ربحية وشركات أتمتة العمليات الروبوتية UiPath و Ripcord و Blue Prism. تستخدم Candor ، وهي شركة ناشئة تهدف إلى تحقيق الشفافية في صناعة الرهن العقاري ، Textract لاستخراج البيانات من المستندات مثل كشوف الحسابات البنكية وقسائم الدفع ومستندات ضريبية مختلفة لتسريع عملية الموافقة على القروض لعملائها.

قال Swami Sivasubramanian ، نائب رئيس Amazon Machine Learning ، "تكمن قوة Amazon Textract في أنه يستخرج بدقة البيانات النصية والمنظمة من أي مستند تقريبًا دون الحاجة إلى تعلم آلي مسبق". "بالإضافة إلى التكامل مع خدمات AWS الأخرى ، فإن المجتمع الكبير الذي ينمو حول Amazon Textract يتيح لعملائنا الحصول على قيمة حقيقية من مجموعات الملفات الخاصة بهم ، والعمل بكفاءة أكبر ، وتحسين الامتثال الأمني ​​، وأتمتة إدخال البيانات ، وتسريع قرارات الأعمال."

أدناه يمكنك مشاهدة عرض Textract على موقع re: Invent 2018 باللغة الإنجليزية.



المصدر: 3dnews.ru

إضافة تعليق