تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
ڊيٽا تي هلندڙ الگورتھم جهڙوڪ نيورل نيٽ ورڪ دنيا کي طوفان سان ورتو آهي. انهن جي ترقي ڪيترن ئي سببن جي ڪري آهي، بشمول سستا ۽ طاقتور هارڊويئر ۽ ڊيٽا جي وڏي مقدار. نيورل نيٽ ورڪ هن وقت ”معرفت“ جي ڪمن سان لاڳاپيل هر شيءِ جي اڳيان آهن جهڙوڪ تصوير جي سڃاڻپ، قدرتي ٻولي سمجھڻ وغيره. پر انهن کي اهڙن ڪمن تائين محدود نه رکڻ گهرجي. هي مواد هڪ طريقو بيان ڪري ٿو تصويرن کي دٻائڻ لاءِ نيورل نيٽ ورڪ استعمال ڪندي بقايا سکيا استعمال ڪندي. آرٽيڪل ۾ پيش ڪيل طريقي سان معياري ڪوڊيڪس کان تيز ۽ بهتر ڪم ڪري ٿو. اسڪيمون، مساوات ۽، يقينا، ڪٽ جي هيٺان ٽيسٽ سان ٽيبل.

هن مضمون تي ٻڌل آهي هي ڪم اهو فرض ڪيو ويو آهي ته توهان نيورل نيٽ ورڪن ۽ انهن جي تصورن کان واقف آهيو ڪنوليشن и نقصان جي فنڪشن.

تصويري ڪمپريشن ڇا آهي ۽ ڪهڙي قسم ۾ اچي ٿو؟

تصويري ڪمپريشن هڪ تصوير کي تبديل ڪرڻ جو عمل آهي ته جيئن اهو گهٽ جاء وٺندو آهي. بس تصويرن کي محفوظ ڪرڻ تمام گھڻي جاءِ وٺي ويندي، ان ڪري اتي ڪيڊڪس آھن جھڙوڪ JPEG ۽ PNG جن جو مقصد اصل تصوير جي سائيز کي گھٽائڻ آھي.

جئين توهان کي خبر آهي، اتي ٻه قسم جا آهن تصويري کمپريشن: ڪو نقصان и نقصان سان. جيئن ته نالا تجويز ڪن ٿا، نقصان کان سواء ڪمپريشن اصل تصوير ڊيٽا کي بحال ڪري سگهي ٿو، جڏهن ته نقصان واري کمپريشن کمپريشن دوران ڪجهه ڊيٽا وڃائي ٿو. مثال طور، JPG نقصانڪار الگورتھم آھن [تقريبن. ترجمو - بنيادي طور تي، اچو ته نقصان جي بغير JPEG جي باري ۾ نه وساريو]، ۽ PNG هڪ نقصان کان سواء الگورتھم آهي.

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
نقصان واري ۽ نقصان واري کمپريشن جو مقابلو

ياد رهي ته ساڄي پاسي واري تصوير ۾ تمام گهڻيون بلاڪ ٿيل نمونا آهن. هي گم ٿيل معلومات آهي. ملندڙ رنگن جا ويجها پکسلز هڪ ايراضيءَ طور ڪمپريس ڪيا ويندا آهن ته جيئن جاءِ بچائڻ لاءِ، پر اصل پکسلز بابت ڄاڻ گم ٿي ويندي آهي. يقينن، JPEG، PNG، وغيره ڪوڊيڪس ۾ استعمال ٿيل الگورتھم تمام گهڻو پيچيده آهن، پر اهو نقصانڪار ڪمپريشن جو هڪ سٺو مثالي مثال آهي. نقصان کان سواء ڪمپريشن سٺو آهي، پر نقصان جي بغير ڪمپريشن فائلن کي تمام گهڻو ڊسڪ جاء وٺي ٿو. ڪيتريون ئي معلومات وڃائڻ کان سواءِ تصويرن کي دٻائڻ لاءِ وڌيڪ ڪارآمد طريقا آهن، پر اهي ڪافي سستا آهن ۽ ڪيترائي استعمال ڪرڻ وارا طريقا استعمال ڪن ٿا. هن جو مطلب اهو آهي ته اهي متوازي ۾ ڪيترن ئي سي پي يو يا GPU ڪور تي هلائي نٿا سگهن. اها حد انهن کي روزمره جي استعمال لاءِ مڪمل طور تي غير عملي بڻائي ٿي.

Convolutional Neural Network Input

جيڪڏھن ڪنھن شيءِ کي ڳڻڻ جي ضرورت آھي ۽ حساب لڳ ڀڳ ٿي سگھي ٿو، شامل ڪريو اعصابي نيٽ ورڪ. ليکڪن تصويري کمپريشن کي بهتر ڪرڻ لاءِ هڪ معياري معياري ڪنووليشنل نيورل نيٽ ورڪ استعمال ڪيو. پيش ڪيل طريقو نه رڳو بهترين حلن سان برابري تي ڪم ڪري ٿو (جيڪڏهن بهتر نه هجي)، اهو پڻ متوازي ڪمپيوٽنگ استعمال ڪري سگهي ٿو، جنهن جي نتيجي ۾ رفتار ۾ ڊرامائي واڌارو آهي. ان جو سبب اهو آهي ته convolutional neural networks (CNNs) تصويرن مان مقامي معلومات ڪڍڻ ۾ تمام سٺا آهن، جن کي پوءِ وڌيڪ ٺهڪندڙ شڪل ۾ پيش ڪيو ويندو آهي (مثال طور، صرف تصوير جا ”اهم“ بٽ رکيل آهن). ليکڪن کي CNN جي ھن خصوصيت کي استعمال ڪرڻ چاھيو ٿا تصويرن جي بھتر نمائندگي ڪرڻ لاءِ.

تعمير

ليکڪ هڪ ٻه نيٽ ورڪ تجويز ڪيو. پهريون نيٽ ورڪ ان پٽ جي طور تي هڪ تصوير وٺي ٿو ۽ هڪ ٺهيل نمائندگي (ComCNN) ٺاهي ٿو. هن نيٽ ورڪ جي پيداوار وري هڪ معياري ڪوڊيڪ (جهڙوڪ JPEG) ذريعي پروسيس ڪئي ويندي آهي. هڪ دفعو ڪوڊيڪ طرفان پروسيس ڪيو ويو آهي، تصوير هڪ سيڪنڊ نيٽ ورڪ ڏانهن موڪليو ويو آهي، جيڪو اصل تصوير واپس ڪرڻ جي ڪوشش ۾ ڪوڊيڪ کان تصوير کي "درست" ڪري ٿو. ليکڪن هن نيٽ ورڪ کي تعميراتي CNN (RecCNN) سڏيو آهي. GANs وانگر، ٻئي نيٽ ورڪ کي تربيتي طور تي تربيت ڏني وئي آهي.

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
ComCNN Compact نمائندگي معياري ڪوڊيڪ ڏانهن منتقل ڪيو ويو

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
RecCNN. ComCNN جي پيداوار کي وڌايو ويو آهي ۽ RecCNN کي فيڊ ڪيو ويو آهي، جيڪو باقي سکڻ جي ڪوشش ڪندو

ڪوڊيڪ آئوٽ اپ اسڪيل ٿيل آهي ۽ پوءِ RecCNN ڏانهن فيڊ ڪيو ويو آهي. RecCNN هڪ تصوير ڪڍڻ جي ڪوشش ڪندو جيڪا ممڪن طور اصل سان ملندڙ جلندڙ هجي.

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
آخر کان آخر تائين تصويري ڪمپريشن فريم ورڪ. Co(.) هڪ تصويري ڪمپريشن الگورٿم آهي. ليکڪ استعمال ڪيو JPEG، JPEG2000 ۽ BPG

باقي ڇا آهي؟

باقي سمجهي سگهجي ٿو پوسٽ پروسيسنگ قدم جي طور تي "وڌائڻ" جي تصوير کي ڪوڊيڪ طرفان ڊيڪوڊ ڪيو پيو وڃي. دنيا جي باري ۾ تمام گهڻي "معلومات" سان، هڪ نيورل نيٽورڪ سنجڪاتي فيصلا ڪري سگهي ٿو ته ڇا حل ڪيو وڃي. هن خيال تي ٻڌل آهي بقايا تربيت، تفصيل پڙهو جنهن بابت توهان ڪري سگهو ٿا هتي.

نقصان جي ڪارڪردگي

ٻه نقصان جا ڪم استعمال ڪيا ويا آهن ڇو ته اسان وٽ ٻه نيورل نيٽ ورڪ آهن. انهن مان پهريون، ComCNN، ليبل ٿيل آهي L1 ۽ هيٺ ڏنل بيان ڪيو ويو آهي:

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
ComCNN لاء نقصان فنڪشن

وضاحت

هي مساوات شايد پيچيده لڳي، پر اهو اصل ۾ معياري آهي (مطلب مربع غلطي) MSE. ||² جو مطلب آهي ویکٹر جو معيار جنهن کي اهي بند ڪن ٿا.

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
مساوات 1.1

Cr ComCNN جي پيداوار کي ظاهر ڪري ٿو. θ ComCNN پيٽرولر جي تربيت جي صلاحيت کي ظاهر ڪري ٿو، XK ان پٽ تصوير آهي

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
مساوات 1.2

Re() RecCNN لاء آهي. هي مساوات صرف مساوات 1.1 جي قيمت RecCNN ڏانهن منتقل ڪري ٿي. θ RecCNN جي ٽرينبل پيرا ميٽرز کي ظاهر ڪري ٿو (مٿي تي ڪيپ جو مطلب آهي ته پيرا ميٽر مقرر ٿيل آهن).

وصف

مساوات 1.0 ComCNN کي مجبور ڪندو ته ان جو وزن تبديل ڪيو وڃي جيئن، جڏهن RecCNN کي استعمال ڪندي ٻيهر ٺاهيو وڃي، ته آخري تصوير ان پٽ تصوير وانگر ممڪن طور تي ساڳي نظر اچي. ٻئي RecCNN نقصان جي فنڪشن کي ھيٺ ڏنل بيان ڪيو ويو آھي:

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
مساوات 2.0

وضاحت

ٻيهر فنڪشن پيچيده نظر اچي سگهي ٿو، پر اهو سڀ کان وڌيڪ حصو لاء هڪ معياري نيورل نيٽورڪ نقصان فنڪشن (MSE) آهي.

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
مساوات 2.1

Co() مطلب ڪوڊيڪ آئوٽ، x مٿي تي ڪيپ سان مطلب ComCNN آئوٽ. θ2 RecCNN جا ٽرينبل پيرا ميٽر آهن، res() صرف RecCNN جي بقايا پيداوار آهي. اهو نوٽ ڪرڻ جي قابل آهي ته RecCNN Co() ۽ ان پٽ تصوير جي وچ ۾ فرق تي تربيت ڪئي وئي آهي، پر ان پٽ تصوير تي نه.

وصف

Equation 2.0 RecCNN کي مجبور ڪندو ته ان جو وزن تبديل ڪري ته جيئن آئوٽ پُٽ ان پٽ تصوير وانگر ممڪن هجي.

سکيا وارو منصوبو

ماڊلز ٽريننگ طور تي تربيت ڪئي وئي آهي، جهڙوڪ گان. پهرين ماڊل جا وزن مقرر ڪيا ويندا آهن جڏهن ته ٻئي ماڊل جا وزن اپڊيٽ ڪيا ويندا آهن، پوءِ ٻئي ماڊل جا وزن مقرر ڪيا ويندا آهن جڏهن ته پهرين ماڊل کي تربيت ڏني ويندي آهي.

ٽيسٽ

ليکڪ پنهنجي طريقي سان موجوده طريقن سان مقابلو ڪيو، جنهن ۾ سادي ڪوڊيڪس شامل آهن. مناسب هارڊويئر تي تيز رفتار برقرار رکڻ دوران انهن جو طريقو ٻين کان بهتر ڪم ڪري ٿو. اضافي طور تي، ليکڪ صرف ٻن نيٽ ورڪن مان هڪ استعمال ڪرڻ جي ڪوشش ڪئي ۽ ڪارڪردگي ۾ گهٽتائي جو ذڪر ڪيو.

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي
ساخت جي هڪجهڙائي انڊيڪس (SSIM) مقابلي. اعلي قدر اصل سان بهتر هڪجهڙائي ظاهر ڪن ٿا. ليکڪن جي ڪم جا نتيجا جرئت ۾ نمايان ٿيل آهن.

ٿڪل

اسان تصويري ڪمپريشن لاءِ گہرے سکيا کي استعمال ڪرڻ لاءِ نئين طريقي تي غور ڪيو، ۽ "عام" کان ٻاهر ڪمن ۾ نيورل نيٽ ورڪ استعمال ڪرڻ جي امڪان بابت ڳالهايو، جهڙوڪ تصوير جي درجه بندي ۽ ٻولي پروسيسنگ. اهو طريقو نه رڳو جديد گهرجن کان گهٽ ناهي، پر توهان کي تصويرن کي تمام تيزيء سان پروسيس ڪرڻ جي اجازت پڻ ڏئي ٿي.

نيورل نيٽ ورڪ جو مطالعو ڪرڻ آسان ٿي ويو آهي، ڇاڪاڻ ته اسان خاص طور تي خابرا جي رهاڪن لاءِ هڪ پروموشنل ڪوڊ ٺاهيو آهي HABR، بينر تي ظاهر ڪيل رعايت تي اضافي 10٪ رعايت ڏيو.

تصويرن کي وڌيڪ ڪمپريس ڪرڻ لاءِ AI استعمال ڪندي

وڌيڪ ڪورس

خاص مضمون

جو ذريعو: www.habr.com

تبصرو شامل ڪريو