نئون آپٽيڪل ٽيڪسٽ ريڪگنيشن سسٽم EasyOCR

پروجيڪٽ آسان او سي آر هڪ نئون آپٽيڪل ٽيڪسٽ ريڪگنيشن سسٽم تيار ڪيو پيو وڃي جيڪو 40 کان وڌيڪ ٻولين کي سپورٽ ڪري ٿو، جن ۾ انگريزي، جرمن، فرينچ، جاپاني، چيني، ڪورين، ازبڪ، آذربائيجاني ۽ لٿوينين شامل آهن. سيريلڪ-بنياد ٻولين کي اڃا تائين سپورٽ نه آهي، پر انهن کي منصوبن جي فهرست ۾ شامل ڪيو پيو وڃي. ڪوڊ فريم ورڪ استعمال ڪندي Python ۾ لکيل آهي پائي ٽيچ и طرفان ورهايل Apache 2.0 تحت لائسنس يافته. لوڊ ڪرڻ لاء مهيا ڪيا ويا آهن لاطيني الفابيٽ ۽ hieroglyphs جي بنياد تي ٻولين لاء تيار ڪيل ماڊل.

مشين جي سکيا جا طريقا استعمال ڪيا ويندا آھن ھڪڙي تصوير ۾ متن کي سڃاڻڻ ۽ سڃاڻڻ لاءِ. هڪ مشين لرننگ الگورتھم استعمال ڪيو ويندو آهي متن کي سڃاڻڻ لاءِ ڀرت (ڪردار-علائقي آگاهي متن لاءِ) ۾ عمل درآمد PyTorch لاءِ، قابليت واري شين تي متن کي نمايان ڪرڻ جي قابل، بشمول ليبل، معلوماتي نشانيون ۽ روڊ نشانيون. ڪردارن جي ترتيبن کي سڃاڻڻ لاءِ هڪ قاعدي واري بار بار نيورل نيٽ ورڪ استعمال ڪيو ويندو آهي سي آر اين اين (Convolutional Recurrent Neural Network، DCNN ۽ RNN جو مجموعو) ۽ الگورتھم CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) نيورل نيٽورڪ آئوٽ پٽ کي متن جي نمائندگي ۾ ڊيڪوڊ ڪرڻ لاءِ.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو