نظام التعرف الضوئي على النص الجديد EasyOCR

مشروع EasyOCR ويجري تطوير نظام جديد للتعرف البصري على النصوص يدعم أكثر من 40 لغة، بما في ذلك الإنجليزية والألمانية والفرنسية واليابانية والصينية والكورية والأوزبكية والأذربيجانية والليتوانية. اللغات السيريلية غير مدعومة بعد، ولكن تتم إضافتها إلى قائمة الخطط. تتم كتابة الكود بلغة بايثون باستخدام إطار العمل PyTorch и وزعت من خلال مرخص تحت أباتشي 2.0. للتحميل متاح نماذج جاهزة للغات تعتمد على الأبجدية اللاتينية والهيروغليفية.

تُستخدم أساليب التعلم الآلي لتحديد النص الموجود في الصورة والتعرف عليه. يتم استخدام خوارزمية التعلم الآلي لتحديد النص حرفة (الوعي بمنطقة الشخصية للنص) في تطبيق بالنسبة لـ PyTorch، فهو قادر على تمييز النص على كائنات عشوائية، بما في ذلك الملصقات وإشارات المعلومات وإشارات الطرق. يتم استخدام الشبكة العصبية التلافيفية المتكررة للتعرف على تسلسل الأحرف CRNN (الشبكة العصبية المتكررة التلافيفية، وهي مزيج من DCNN وRNN) والخوارزمية CTC BeamSearch CTC BeamSearch (التصنيف الزمني للاتصال) لفك تشفير مخرجات الشبكة العصبية إلى تمثيل نصي.

المصدر: opennet.ru

إضافة تعليق