புதிய ஒளியியல் உரை அங்கீகார அமைப்பு EasyOCR

திட்டம் EasyOCR ஆங்கிலம், ஜெர்மன், பிரஞ்சு, ஜப்பானியம், சீனம், கொரியன், உஸ்பெக், அஜர்பைஜான் மற்றும் லிதுவேனியன் உள்ளிட்ட 40க்கும் மேற்பட்ட மொழிகளை ஆதரிக்கும் புதிய ஆப்டிகல் டெக்ஸ்ட் ரெகக்னிஷன் சிஸ்டம் உருவாக்கப்படுகிறது. சிரிலிக் அடிப்படையிலான மொழிகள் இன்னும் ஆதரிக்கப்படவில்லை, ஆனால் அவை திட்டங்களின் பட்டியலில் சேர்க்கப்படுகின்றன. குறியீடு கட்டமைப்பைப் பயன்படுத்தி பைத்தானில் எழுதப்பட்டுள்ளது பைடோர்ச் и வழங்கியது Apache 2.0 இன் கீழ் உரிமம் பெற்றது. ஏற்றுவதற்கு வழங்கப்படுகின்றன லத்தீன் எழுத்துக்கள் மற்றும் ஹைரோகிளிஃப்களின் அடிப்படையில் மொழிகளுக்கான ஆயத்த மாதிரிகள்.

ஒரு படத்தில் உள்ள உரையை அடையாளம் காணவும் அங்கீகரிக்கவும் இயந்திர கற்றல் முறைகள் பயன்படுத்தப்படுகின்றன. மெஷின் லேர்னிங் அல்காரிதம் உரையை அடையாளம் காண பயன்படுகிறது கைவினை (உரைக்கான எழுத்து-மண்டல விழிப்புணர்வு) இல் செயல்படுத்தல் PyTorch க்கு, லேபிள்கள், தகவல் அடையாளங்கள் மற்றும் சாலை அடையாளங்கள் உட்பட தன்னிச்சையான பொருள்களில் உரையை முன்னிலைப்படுத்தும் திறன் கொண்டது. ஒரு கன்வல்யூஷனல் ரீகரெண்ட் நியூரல் நெட்வொர்க் எழுத்துத் தொடர்களை அடையாளம் காண பயன்படுத்தப்படுகிறது சிஆர்என்என் (Convolutional Recurrent Neural Network, DCNN மற்றும் RNN ஆகியவற்றின் கலவை) மற்றும் அல்காரிதம் CTC BeamSearch CTC BeamSearch (கனெக்ஷனிஸ்ட் டெம்போரல் கிளாசிஃபிகேஷன்) நரம்பியல் நெட்வொர்க் வெளியீட்டை உரை பிரதிநிதித்துவமாக டிகோட் செய்ய.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்