د عکسونو ډیر کمپریس کولو لپاره د AI کارول

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
د ډیټا لخوا پرمخ وړل شوي الګوریتمونه لکه عصبي شبکې نړۍ د طوفان لخوا نیولې ده. د دوی پراختیا د ډیری دلایلو لخوا پرمخ وړل کیږي ، پشمول ارزانه او قوي هارډویر او د ډیټا لوی مقدار. عصبي شبکې اوس مهال د هر هغه څه په سر کې دي چې د "ادراک" دندو پورې اړوند دي لکه د عکس پیژندنه، د طبیعي ژبې پوهه، او داسې نور. مګر دوی باید په داسې کارونو پورې محدود نه وي. دا مواد د پاتې زده کړې په کارولو سره د عصبي شبکو په کارولو سره د عکسونو کمپریس کولو میتود تشریح کوي. په مقاله کې وړاندې شوي چلند د معیاري کوډیکونو په پرتله ګړندی او غوره کار کوي. سکیمونه، مساوات او البته، یو میز د کټ لاندې ازموینې سره.

دا مقاله پر بنسټ ولاړه ده دا کار داسې انګیرل کیږي چې تاسو د عصبي شبکو او د دوی مفاهیمو سره آشنا یاست. convolution и د ضایع فعالیت.

د عکس کمپریشن څه شی دی او کوم ډولونه راځي؟

د عکس کمپریشن د عکس بدلولو پروسه ده ترڅو دا لږ ځای ونیسي. په ساده ډول د عکسونو ذخیره کول به ډیر ځای ونیسي، نو د JPEG او PNG په څیر کوډیکونه شتون لري چې موخه یې د اصلي عکس اندازه کمول دي.

لکه څنګه چې تاسو پوهیږئ، د عکس کمپریشن دوه ډوله شتون لري: هیڅ زیان نشته и له زیانونو سره. لکه څنګه چې نومونه وړاندیز کوي، بې ضرر کمپریشن کولی شي د اصلي عکس ډیټا بیرته ترلاسه کړي، پداسې حال کې چې زیانمن کمپریشن د کمپریشن پرمهال ځینې معلومات له لاسه ورکوي. د مثال په توګه، JPG زیانمن الګوریتمونه دي [نږدې. ژباړه - اساسا، راځئ چې د بې ضرر JPEG په اړه هم هیر نکړو، او PNG یو بې زیان الګوریتم دی.

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
د ضایع او زیانمن کمپریشن پرتله کول

په یاد ولرئ چې عکس په ښي خوا کې ډیری بلاکي آثار لري. دا معلومات ورک شوي دي. د ورته رنګونو نږدې پکسلونه د ځای خوندي کولو لپاره د یوې ساحې په توګه فشار شوي، مګر د اصلي پکسلونو په اړه معلومات ورک شوي. البته، په JPEG، PNG، او داسې نورو کوډیکونو کې کارول شوي الګوریتمونه خورا پیچلي دي، مګر دا د زیانمن کمپریشن یو ښه رواني مثال دی. بې ضرر کمپریشن ښه دی، مګر د ضایع کیدو پرته کمپریس شوي فایلونه ډیر ډیسک ځای نیسي. د ډیرو معلوماتو له لاسه ورکولو پرته د عکسونو کمپرس کولو لپاره ډیرې اغیزمنې لارې شتون لري، مګر دا خورا ورو دي او ډیری یې تکراري طریقې کاروي. دا پدې مانا ده چې دوی نشي کولی په څو CPU یا GPU کورونو کې موازي چل شي. دا محدودیت دوی د ورځني کارونې لپاره په بشپړ ډول غیر عملي کوي.

Convolutional Neural Network Input

که یو څه محاسبه کولو ته اړتیا ولري او محاسبه ممکن نږدې وي، اضافه کړئ عصبي شبکه. لیکوالانو د عکس کمپریشن ښه کولو لپاره په کافي اندازه معیاري عصبي عصبي شبکه کارولې. وړاندې شوی میتود نه یوازې د غوره حلونو سره په مساوي ډول ترسره کوي (که غوره نه وي) ، دا کولی شي موازي کمپیوټري هم وکاروي ، په پایله کې په سرعت کې ډراماتیک زیاتوالی. دلیل یې دا دی چې د عصبي عصبي شبکې (CNNs) له عکسونو څخه د ځایي معلوماتو په استخراج کې خورا ښه دي ، کوم چې بیا په ډیر کمپیکٹ شکل کې ښودل کیږي (د مثال په توګه ، یوازې د عکس "مهم" بټونه ساتل کیږي). لیکوالانو غوښتل چې د CNN دا ځانګړتیا د انځورونو ښه استازیتوب لپاره وکاروي.

معمارۍ

لیکوالانو دوه ګونی شبکه وړاندیز کړې. لومړی شبکه د ان پټ په توګه یو عکس اخلي او یو کمپیک نمایش (ComCNN) رامینځته کوي. د دې شبکې محصول بیا د معیاري کوډیک (لکه JPEG) لخوا پروسس کیږي. یوځل چې د کوډیک لخوا پروسس شي ، عکس دوهم شبکې ته لیږل کیږي ، کوم چې د اصلي عکس بیرته راستنیدو په هڅه کې د کوډیک څخه عکس "سم کوي". لیکوالانو دا شبکه د بیا رغونې CNN (RecCNN) بللې. د GANs په څیر، دواړه شبکې په تکراري توګه روزل شوي.

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
د ComCNN تړون نمایندګي معیاري کوډیک ته لیږدول کیږي

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
RecCNN. د ComCNN محصول لوړ شوی او RecCNN ته تغذیه شوی ، کوم چې به هڅه وکړي پاتې زده کړي

د کوډیک محصول لوړ شوی او بیا RecCNN ته ورکول کیږي. RecCNN به هڅه وکړي یو عکس تولید کړي چې د امکان تر حده اصلي سره ورته وي.

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
له پای څخه تر پای پورې د عکس کمپریشن چوکاټ. Co(.) د عکس کمپریشن الګوریتم دی. لیکوالانو JPEG، JPEG2000 او BPG کارولي

پاتې څه دي؟

پاتې د کوډیک لخوا کوډ شوي عکس "لوړولو" لپاره د پروسس کولو وروسته ګام په توګه فکر کیدی شي. د نړۍ په اړه د ډیری "معلوماتو" سره، یو عصبي شبکه کولی شي د څه حل کولو په اړه ادراکي پریکړې وکړي. دا مفکوره پر بنسټ ولاړه ده پاتې روزنه، د هغه په ​​اړه توضیحات ولولئ چې تاسو یې کولی شئ دلته.

د دندې ضایع کول

دوه د لاسه ورکولو افعال کارول کیږي ځکه چې موږ دوه عصبي شبکې لرو. د دې لومړی، ComCNN، L1 لیبل شوی او په لاندې ډول تعریف شوی:

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
د ComCNN لپاره د ضایع فعالیت

تشریح

دا مساوات ممکن پیچلي ښکاري، مګر دا په حقیقت کې معیاري دی (د مربع غلطی معنی) MSE. ||² د ویکتور نورم معنی لري چې دوی یې تړلي دي.

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
مساوات 1.1

Cr د ComCNN محصول څرګندوي. θ د ComCNN پیرامیټونو د روزنې وړتیا په ګوته کوي، XK د ان پټ انځور دی

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
مساوات 1.2

Re() د RecCNN لپاره ولاړ دی. دا مساوات په ساده ډول د 1.1 مساوات ارزښت RecCNN ته لیږدوي. θ د RecCNN د روزنې وړ پیرامیټرې په ګوته کوي (په پورتنۍ برخه کې کیپ پدې معنی چې پیرامیټونه ثابت شوي).

عقلي تعریف

مساوات 1.0 به ComCNN دې ته اړ کړي چې خپل وزنونه بدل کړي داسې چې کله چې د RecCNN په کارولو سره بیا جوړ شي، وروستی عکس د امکان تر حده د ان پټ عکس سره ورته ښکاري. د دوهم RecCNN ضایع فعالیت په لاندې ډول تعریف شوی:

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
مساوات 2.0

تشریح

یوځل بیا فعالیت ممکن پیچلي ښکاري ، مګر دا د ډیری برخې لپاره د معیاري عصبي شبکې ضایع فعالیت (MSE) دی.

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
مساوات 2.1

Co() د کوډیک محصول معنی لري، x په سر کې د خولۍ سره د ComCNN محصول معنی لري. θ2 د RecCNN د روزنې وړ پیرامیټونه دي، res() په ساده ډول د RecCNN پاتې برخه ده. د یادولو وړ ده چې RecCNN د Co() او د ان پټ عکس تر مینځ د توپیر په اړه روزل شوی ، مګر د ان پټ عکس کې نه.

عقلي تعریف

مساوي 2.0 به RecCNN مجبور کړي چې خپل وزن بدل کړي ترڅو محصول د امکان تر حده د ان پټ عکس سره ورته ښکاري.

د زده کړې سکیم

موډلونه په تکراري توګه روزل شوي، ورته ورته GAN. د لومړي ماډل وزنونه ټاکل شوي پداسې حال کې چې د دوهم ماډل وزن تازه کیږي ، بیا د دوهم ماډل وزنونه ټاکل کیږي پداسې حال کې چې لومړی ماډل روزل کیږي.

ازموینې

لیکوالانو خپل میتود د موجوده میتودونو سره پرتله کړی ، پشمول د ساده کوډیکونو. د دوی میتود د نورو په پرتله ښه کار کوي پداسې حال کې چې په مناسب هارډویر کې لوړ سرعت ساتي. برسیره پردې، لیکوالانو هڅه وکړه چې یوازې د دوو شبکو څخه یو وکاروي او په فعالیت کې کمښت یې یادونه وکړه.

د عکسونو ډیر کمپریس کولو لپاره د AI کارول
د ساختماني ورته والی شاخص پرتله کول (SSIM). لوړ ارزښتونه د اصلي سره ښه ورته والی په ګوته کوي. بولډ ډول د لیکوالانو د کار پایله په ګوته کوي

پایلې

موږ د عکس کمپریشن لپاره د ژورې زده کړې کارولو لپاره نوې لاره وڅیړله، او د "عمومي" څخه هاخوا دندو کې د عصبي شبکو کارولو احتمال په اړه خبرې وکړې، لکه د انځور طبقه بندي او د ژبې پروسس کول. دا طریقه نه یوازې د عصري اړتیاو څخه ټیټه نه ده، بلکې تاسو ته اجازه درکوي چې عکسونه خورا ګړندي پروسس کړئ.

د عصبي شبکو زده کړه اسانه شوې ده، ځکه چې موږ یو پروموشنل کوډ جوړ کړی دی په ځانګړې توګه د خبری اوسیدونکو لپاره HABRپه بینر کې ښودل شوي تخفیف ته اضافي 10٪ تخفیف ورکول.

د عکسونو ډیر کمپریس کولو لپاره د AI کارول

نور کورسونه

ځانګړي شوي مقالې

سرچینه: www.habr.com

Add a comment