නව දෘශ්‍ය පෙළ හඳුනාගැනීමේ පද්ධතිය EasyOCR

ව්යාපෘතිය EasyOCR ඉංග්‍රීසි, ජර්මන්, ප්‍රංශ, ජපන්, චීන, කොරියානු, උස්බෙක්, අසර්බයිජානියානු සහ ලිතුවේනියානු ඇතුළු භාෂා 40කට වැඩි ප්‍රමාණයකට සහය දක්වන නව දෘශ්‍ය පෙළ හඳුනාගැනීමේ පද්ධතියක් සංවර්ධනය වෙමින් පවතී. සිරිලික් මත පදනම් වූ භාෂා තවමත් සහාය නොදක්වයි, නමුත් ඒවා සැලසුම් ලැයිස්තුවට එකතු කරනු ලැබේ. කේතය පයිතන් වලින් ලියා ඇත්තේ රාමුව භාවිතා කරමිනි පයිටෝර්ච් и විසින් බෙදා හරිනු ලැබේ Apache 2.0 යටතේ බලපත්‍ර ලබා ඇත. පැටවීම සඳහා සපයනු ලැබේ ලතින් හෝඩිය සහ හයිරොග්ලිෆ් මත පදනම් වූ භාෂා සඳහා සූදානම් කළ ආකෘති.

රූපයක ඇති පෙළ හඳුනා ගැනීමට සහ හඳුනා ගැනීමට යන්ත්‍ර ඉගෙනීමේ ක්‍රම භාවිතා කරයි. පෙළ හඳුනා ගැනීමට යන්ත්‍ර ඉගෙනීමේ ඇල්ගොරිතමයක් භාවිතා කරයි CRAFT (පෙළ සඳහා අක්ෂර කලාප දැනුවත් කිරීම) තුළ ක්රියාත්මක කිරීම PyTorch සඳහා, ලේබල්, තොරතුරු සංඥා සහ මාර්ග සංඥා ඇතුළු අත්තනෝමතික වස්තූන් මත පෙළ උද්දීපනය කිරීමට හැකියාව ඇත. අක්ෂර අනුපිළිවෙල හඳුනා ගැනීම සඳහා පරිවර්තනීය පුනරාවර්තන ස්නායුක ජාලයක් භාවිතා කරයි CRNN (Convolutional Recurrent Neural Network, DCNN සහ RNN වල එකතුවක්) සහ ඇල්ගොරිතම CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) ස්නායු ජාල ප්‍රතිදානය පෙළ නිරූපණයට විකේතනය කිරීමට.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න