پروجيڪٽ آسان او سي آر هڪ نئون آپٽيڪل ٽيڪسٽ ريڪگنيشن سسٽم تيار ڪيو پيو وڃي جيڪو 40 کان وڌيڪ ٻولين کي سپورٽ ڪري ٿو، جن ۾ انگريزي، جرمن، فرينچ، جاپاني، چيني، ڪورين، ازبڪ، آذربائيجاني ۽ لٿوينين شامل آهن. سيريلڪ-بنياد ٻولين کي اڃا تائين سپورٽ نه آهي، پر انهن کي منصوبن جي فهرست ۾ شامل ڪيو پيو وڃي. ڪوڊ فريم ورڪ استعمال ڪندي Python ۾ لکيل آهي پائي ٽيچ и طرفان ورهايل Apache 2.0 تحت لائسنس يافته. لوڊ ڪرڻ لاء مهيا ڪيا ويا آهن لاطيني الفابيٽ ۽ hieroglyphs جي بنياد تي ٻولين لاء تيار ڪيل ماڊل.
مشين جي سکيا جا طريقا استعمال ڪيا ويندا آھن ھڪڙي تصوير ۾ متن کي سڃاڻڻ ۽ سڃاڻڻ لاءِ. هڪ مشين لرننگ الگورتھم استعمال ڪيو ويندو آهي متن کي سڃاڻڻ لاءِ ڀرت (ڪردار-علائقي آگاهي متن لاءِ) ۾ عمل درآمد PyTorch لاءِ، قابليت واري شين تي متن کي نمايان ڪرڻ جي قابل، بشمول ليبل، معلوماتي نشانيون ۽ روڊ نشانيون. ڪردارن جي ترتيبن کي سڃاڻڻ لاءِ هڪ قاعدي واري بار بار نيورل نيٽ ورڪ استعمال ڪيو ويندو آهي سي آر اين اين (Convolutional Recurrent Neural Network، DCNN ۽ RNN جو مجموعو) ۽ الگورتھم CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) نيورل نيٽورڪ آئوٽ پٽ کي متن جي نمائندگي ۾ ڊيڪوڊ ڪرڻ لاءِ.
جو ذريعو: opennet.ru