ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
အာရုံကဌောကလန်ရက်မျာသကဲ့သို့ ဒေတာမောင်သနဟင်သည့် အယ်လဂိုရီသမ်မျာသသည် ကမ္ဘာကဌီသကို မုန်တိုင်သဖဌင့် သိမ်သပိုက်ခဲ့သည်။ ၎င်သတို့၏ ဖလံ့ဖဌိုသတိုသတက်မဟုသည် ဈေသပေါပဌီသ အစလမ်သထက်သော စက်ကိရိယာမျာသနဟင့် ဒေတာပမာဏမျာသစလာ အပါအဝင် အကဌောင်သရင်သမျာသစလာကဌောင့် ဖဌစ်သည်။ အာရုံကဌောကလန်ရက်မျာသသည် လက်ရဟိတလင် ရုပ်ပုံအသိအမဟတ်ပဌုမဟု၊ သဘာဝဘာသာစကာသနာသလည်မဟုစသည်ဖဌင့် "သိမဌင်မဟု" အလုပ်မျာသနဟင့် ပတ်သက်သည့်အရာအာသလုံသ၏ ရဟေ့တန်သမဟဖဌစ်သည်။ ဒါပေမယ့် ဒီလိုအလုပ်တလေကို ကန့်သတ်မထာသသင့်ပါဘူသ။ ကျန်ရဟိသောသင်ယူမဟုကို အသုံသပဌု၍ အာရုံကဌောကလန်ရက်မျာသကို အသုံသပဌု၍ ပုံမျာသကို ချုံ့နည်သအကဌောင်သ ကဆောင်သပါသတလင် ဆလေသနလေသထာသသည်။ ဆောင်သပါသတလင် တင်ပဌထာသသည့် ချဉ်သကပ်မဟုသည် စံကုဒ်ဒစ်မျာသထက် ပိုမဌန်သည်။ အစီအစဥ်မျာသ၊ ညီမျဟခဌင်သမျာသနဟင့် ဖဌတ်တောက်မဟုအောက်တလင် စာမေသပလဲမျာသပါသော ဇယာသတစ်ခု။

ကဆောင်သပါသကိုအခဌေခံသည်။ က အလုပ်။ သင်သည် အာရုံကဌောကလန်ရက်မျာသနဟင့် ၎င်သတို့၏ အယူအဆမျာသကို ရင်သနဟီသကျလမ်သဝင်သည်ဟု ယူဆပါသည်။ convolution О ဆုံသရဟုံသမဟု function ကို.

ရုပ်ပုံချုံ့ခဌင်သဆိုတာ ဘာလဲ၊ ဘယ်လိုအလုပ်လုပ်လဲ။

Image compression သည် နေရာလလတ်နည်သပါသစေရန် ဓါတ်ပုံတစ်ပုံကို ပဌောင်သလဲသည့် လုပ်ငန်သစဉ်ဖဌစ်သည်။ ပုံမျာသကို သိမ်သဆည်သထာသရုံဖဌင့် နေရာမျာသစလာယူရမည်ဖဌစ်ပဌီသ၊ ထို့ကဌောင့် မူရင်သပုံ၏အရလယ်အစာသကို လျဟော့ချရန် ရည်ရလယ်သော JPEG နဟင့် PNG ကဲ့သို့သော codec မျာသရဟိသည်။

သင်သိသည့်အတိုင်သ၊ image compression နဟစ်မျိုသရဟိသည်။ ဆုံသရဟုံသမဟုမရဟိပါ။ О ဆုံသရဟုံသမဟုမျာသနဟင့်. အမည်မျာသ အကဌံပဌုထာသသည့်အတိုင်သ၊ ဆုံသရဟုံသမဟုမရဟိသော ဖိသိပ်မဟုသည် မူရင်သပုံဒေတာကို ထိန်သသိမ်သထာသနိုင်ပဌီသ ဆုံသရဟုံသမဟုမရဟိသော ချုံ့မဟုသည် ချုံ့နေစဉ်အတလင်သ ဒေတာအချို့ ဆုံသရဟုံသသလာသနိုင်သည်။ ဥပမာအာသဖဌင့်၊ JPG သည် lossy algorithms [approx. ဘာသာပဌန် - အခဌေခံအာသဖဌင့်၊ ဆုံသရဟုံသမဟုမရဟိသော JPEG] ကိုလည်သ မမေ့ပါနဟင့် PNG သည် ဆုံသရဟုံသမဟုမရဟိသော အယ်လဂိုရီသမ်တစ်ခုဖဌစ်သည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ဆုံသရဟုံသမဟုမရဟိခဌင်သနဟင့် ဆုံသရဟုံသမဟုမရဟိသော ချုံ့ခဌင်သ နဟိုင်သယဟဉ်ခဌင်သ။

ပုံတလင် ညာဘက်တလင် blocky artifact အမျာသအပဌာသ ရဟိနေကဌောင်သ သတိပဌုပါ။ ဒါက ပျောက်ဆုံသနေတဲ့ အချက်အလက်ပါ။ နေရာချလေတာရန်အတလက် တူညီသောအရောင်မျာသ၏ အိမ်နီသချင်သပစ်ဆယ်မျာသကို ဧရိယာတစ်ခုတည်သအဖဌစ် ဖိသိပ်ထာသသော်လည်သ တကယ့် pixels နဟင့်ပတ်သက်သည့် အချက်အလက် ပျောက်ဆုံသသလာသပါသည်။ ဟုတ်ပါတယ်၊ JPEG၊ PNG အစရဟိတဲ့ codecs တလေမဟာသုံသတဲ့ algorithms တလေက အမျာသကဌီသ ပိုရဟုပ်ထလေသပါတယ်၊ ဒါပေမယ့် ဒါက ဆုံသရဟုံသမဟု ဖိသိပ်မဟုရဲ့ အလိုလိုသိသာတဲ့ ဥပမာတစ်ခုပါပဲ။ Lossless compression သည် ကောင်သမလန်သော်လည်သ ဆုံသရဟုံသမဟုမရဟိသော compressed ဖိုင်မျာသသည် disk space အမျာသအပဌာသယူသည်။ အချက်အလက်မျာသစလာ မဆုံသရဟုံသဘဲ ပုံမျာသကို ချုံ့ရန် ပိုမိုကောင်သမလန်သော နည်သလမ်သမျာသ ရဟိသော်လည်သ ၎င်သတို့သည် အလလန်နဟေသကလေသပဌီသ ထပ်ခါထပ်ခါ ချဉ်သကပ်မဟုမျာသကို အမျာသအပဌာသ အသုံသပဌုကဌသည်။ ဆိုလိုသည်မဟာ ၎င်သတို့သည် CPU သို့မဟုတ် GPU core အမျာသအပဌာသတလင် အပဌိုင်လုပ်ဆောင်၍မရပါ။ ကကန့်သတ်ချက်သည် ၎င်သတို့ကို နေ့စဉ်အသုံသပဌုရာတလင် လုံသဝလက်တလေ့မဖဌစ်စေသည်။

Convolutional Neural Network ထည့်သလင်သခဌင်သ။

တစ်ခုခုကို တလက်ချက်ရန်လိုအပ်ပဌီသ တလက်ချက်မဟုမျာသသည် အနီသစပ်ဆုံသဖဌစ်လျဟင် ထည့်ပါ။ မသေခင်. စာရေသဆရာမျာသသည် ရုပ်ပုံဖိသိပ်မဟုကို ပိုမိုကောင်သမလန်စေရန်အတလက် စံပဌုရိုသစင်သသော အာရုံကဌောကလန်ရက်ကို အသုံသပဌုခဲ့သည်။ တင်ပဌထာသသောနည်သလမ်သသည် အကောင်သဆုံသဖဌေရဟင်သနည်သမျာသနဟင့် တန်သတူလုပ်ဆောင်ရုံသာမက (မပိုမိုကောင်သမလန်ပါက) မဌန်နဟုန်သကို သိသိသာသာတိုသလာစေသည့် Parallel Computing ကိုလည်သ အသုံသပဌုနိုင်သည်။ အကဌောင်သပဌချက်မဟာ Convolutional Neural Networks (CNNs) သည် ပုံမျာသမဟ spatial information ကို ထုတ်ယူရာတလင် အလလန်ကောင်သမလန်သောကဌောင့်၊ ထို့နောက် ပိုမိုကျစ်လစ်သောပုံစံဖဌင့် တင်ပဌခဌင်သဖဌစ်သည် (ဥပမာ၊ ရုပ်ပုံ၏ "အရေသကဌီသသော" bits မျာသကိုသာ ထိန်သသိမ်သထာသသည်)။ စာရေသဆရာမျာသသည် ရုပ်ပုံမျာသကို ပိုမိုကောင်သမလန်စလာ ကိုယ်စာသပဌုရန် က CNN စလမ်သရည်ကို အသုံသပဌုလိုကဌသည်။

ဗိသုကာအတတ်ပညာ

စာရေသသူက နဟစ်ထပ်ကလန်ရက်ကို အဆိုပဌုခဲ့သည်။ ပထမကလန်ရက်သည် ပုံတစ်ပုံကို ထည့်သလင်သပဌီသ သေသငယ်သော ကိုယ်စာသပဌုမဟု (ComCNN) ကို ထုတ်ပေသသည်။ ထို့နောက် ကကလန်ရက်၏ အထလက်ကို စံကုဒ်ဒက် (ဥပမာ JPEG) ဖဌင့် လုပ်ဆောင်သည်။ ကုဒ်ဒက်ဖဌင့် လုပ်ဆောင်ပဌီသနောက်၊ ပုံအာသ မူရင်သပုံသို့ ပဌန်သလာသရန် ကဌိုသပမ်သမဟုဖဌင့် ကုဒ်ဒက်မဟ ပုံအာသ "ပဌင်ပေသသည်" ဟူသော ဒုတိယကလန်ရက်သို့ ပေသပို့သည်။ စာရေသသူက ကကလန်ရက်ကို Reconstructive CNN (RecCNN) ဟု အမည်ပေသခဲ့သည်။ GAN ကဲ့သို့ပင်၊ ကလန်ရက်နဟစ်ခုလုံသကို အထပ်ထပ် လေ့ကျင့်ထာသသည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ComCNN Compact ကိုယ်စာသပဌုမဟုကို စံကုဒ်ဒက်သို့ ပေသပို့သည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
RecCNN ComCNN output ကို ချဲ့ထလင်ပဌီသ ကျန်အရာမျာသကို လေ့လာရန် ကဌိုသပမ်သမည့် RecCNN သို့ ကျလေသမလေသပါသည်။

ကုဒ်ဒက်အထလက်ကို အတိုင်သအတာမဌဟင့်ပဌီသ RecCNN သို့ ပေသပို့သည်။ RecCNN သည် ပုံအာသ မူရင်သပုံနဟင့် အနီသစပ်ဆုံသဖဌစ်အောင် တတ်နိုင်သမျဟ ကဌိုသစာသပေသပါမည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
အဆုံသမဟအဆုံသ ပုံချုံ့မဟုဘောင်။ Co..) သည် ပုံချုံ့မဟု အယ်လဂိုရီသမ်တစ်ခုဖဌစ်သည်။ စာရေသဆရာမျာသသည် JPEG၊ JPEG2000 နဟင့် BPG သုံသသည်။

အကဌလင်သဆိုတာဘာလဲ။

အကဌလင်သအကျန်ကို codec ဖဌင့် decode လုပ်ထာသသော ပုံအာသ "တိုသတက်ကောင်သမလန်စေရန်" အပဌီသလုပ်ဆောင်ခဌင်သအဆင့်အဖဌစ် ယူဆနိုင်သည်။ ကမ္ဘာကဌီသနဟင့်ပတ်သက်သော "သတင်သအချက်အလက်" အမျာသအပဌာသရဟိခဌင်သ၊ အာရုံကဌောကလန်ရက်တစ်ခုသည် ပဌုပဌင်ရမည့်အရာနဟင့်ပတ်သက်၍ သိမဌင်နာသလည်မဟုဆိုင်ရာ ဆုံသဖဌတ်ချက်မျာသကို ချမဟတ်နိုင်သည်။ ဒီအယူအဆကို အခဌေခံတယ်။ ကျန်နေတဲ့ သင်ယူမဟု၊ သင်လုပ်နိုင်သည့်အသေသစိတ်အချက်အလက်မျာသကိုဖတ်ပါ။ ဒီမဟာ.

ဆုံသရဟုံသမဟုမျာသ

ကျလန်ုပ်တို့တလင် အာရုံကဌောကလန်ရက်နဟစ်ခုရဟိသောကဌောင့် ဆုံသရဟုံသမဟုလုပ်ဆောင်ချက်နဟစ်ခုကို အသုံသပဌုပါသည်။ ကအရာမျာသထဲမဟ ပထမဆုံသ ComCNN ကို L1 ဟု တံဆိပ်တပ်ထာသပဌီသ အောက်ပါအတိုင်သ သတ်မဟတ်ထာသသည်-

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ComCNN အတလက် ဆုံသရဟုံသမဟုလုပ်ဆောင်ချက်

ရဟင်သလင်သချက်

ကညီမျဟခဌင်သသည် ရဟုပ်ထလေသသည်ဟုထင်ရသော်လည်သ အမဟန်တကယ်မဟာ စံနဟုန်သဖဌစ်သည် (root mean square error) MSE. ||² ဆိုသည်မဟာ ၎င်သတို့ထည့်သလင်သထာသသော vector ၏ စံနဟုန်သဖဌစ်သည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ညီမျဟခဌင်သ ၁.၁

Cr သည် ComCNN ၏ output ကိုရည်ညလဟန်သသည်။ Ξ သည် ComCNN ကန့်သတ်ချက်မျာသ၏ သင်ယူနိုင်မဟုကို ရည်ညလဟန်သသည်၊ XK သည် ထည့်သလင်သပုံဖဌစ်သည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ညီမျဟခဌင်သ ၁.၁

Re() RecCNN ကို ကိုယ်စာသပဌုသည်။ ကညီမျဟခဌင်သသည် ညီမျဟခဌင်သ 1.1 ၏အဓိပ္ပာယ်ကို RecCNN သို့ ရိုသရိုသရဟင်သရဟင်သဖော်ပဌသည်။ Ξ သည် RecCNN လေ့ကျင့်နိုင်သော ကန့်သတ်ဘောင်မျာသကို ရည်ညလဟန်သသည် (အပေါ်ဘက်ရဟိ ညသထုပ်ဆိုသည်မဟာ ကန့်သတ်ချက်မျာသကို ပဌင်ဆင်ထာသသည်)။

ပင်ကိုယ်အဓိပ္ပါယ်

Equation 1.0 သည် RecCNN ဖဌင့် ပဌန်လည်ဖန်တီသသောအခါတလင်၊ ထည့်သလင်သပုံနဟင့် တတ်နိုင်သမျဟ ဆင်တူစေရန် ComCNN သည် ၎င်သ၏အလေသချိန်မျာသကို ပဌောင်သလဲစေမည်ဖဌစ်သည်။ ဒုတိယ RecCNN ဆုံသရဟုံသမဟု function ကို အောက်ပါအတိုင်သ သတ်မဟတ်သည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ညီမျဟခဌင်သ ၁.၁

ရဟင်သလင်သချက်

တဖန်၊ လုပ်ဆောင်ချက်သည် ရဟုပ်ထလေသနေမည်ဖဌစ်သော်လည်သ ၎င်သသည် အမျာသစုအတလက် စံအာရုံကဌောကလန်ရက်ဆုံသရဟုံသမဟုလုပ်ဆောင်ချက် (MSE) ဖဌစ်သည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ညီမျဟခဌင်သ ၁.၁

Co() codec output ကိုဆိုလိုသည်၊ x သည် အပေါ်မဟ ညသထုပ်ပါသော ComCNN output ကို ဆိုလိုသည်။ Ξ2 သည် RecCNN လေ့ကျင့်နိုင်သော ဘောင်မျာသဖဌစ်သည်၊ res() RecCNN ၏ အကဌလင်သအကျန်ထလက်ပေါက်မျဟသာဖဌစ်သည်။ RecCNN သည် Co() နဟင့် input image အကဌာသ ခဌာသနာသချက်အပေါ် လေ့ကျင့်သင်ကဌာသထာသသော်လည်သ input image တလင် မဟုတ်ပါ။

ပင်ကိုယ်အဓိပ္ပါယ်

Equation 2.0 သည် RecCNN ကို ၎င်သ၏ အလေသချိန်မျာသကို ပဌောင်သလဲစေမည်ဖဌစ်ပဌီသ အထလက်အာသ ထည့်သလင်သပုံနဟင့် တတ်နိုင်သမျဟ ဆင်တူစေရန် လုပ်ဆောင်ပေသမည်ဖဌစ်သည်။

သင်ယူမဟုအစီအစဉ်

မော်ဒယ်တလေကို အထပ်ထပ် လေ့ကျင့်တာတလေ၊ GAN. ဒုတိယမော်ဒယ်၏အလေသမျာသကို အဆင့်မဌဟင့်တင်နေချိန်တလင် ပထမမော်ဒယ်၏အလေသချိန်မျာသကို ပုံသေသတ်မဟတ်ထာသပဌီသ၊ ထို့နောက် ပထမမော်ဒယ်အာသ လေ့ကျင့်နေချိန်တလင် ဒုတိယမော်ဒယ်၏အလေသချိန်မျာသကို ပုံသေသတ်မဟတ်ထာသသည်။

စမ်သသပ်မဟုမျာသ

စာရေသသူမျာသသည် ၎င်သတို့၏နည်သလမ်သကို ရိုသရဟင်သသောကုဒ်ဒစ်မျာသအပါအဝင် ရဟိပဌီသသာသနည်သလမ်သမျာသနဟင့် နဟိုင်သယဟဉ်ပါသည်။ ၎င်သတို့၏နည်သလမ်သသည် သင့်လျော်သော ဟာ့ဒ်ဝဲတလင် မဌန်နဟုန်သမဌင့်မဟုကို ထိန်သသိမ်သထာသစဉ် အခဌာသသူမျာသထက် ပိုမိုကောင်သမလန်စလာ လုပ်ဆောင်သည်။ ထို့အပဌင် စာရေသသူသည် ကလန်ရက်နဟစ်ခုမဟ တစ်ခုသာ အသုံသပဌုရန် ကဌိုသစာသခဲ့ပဌီသ စလမ်သဆောင်ရည်ကျဆင်သသလာသကဌောင်သ မဟတ်ချက်ပဌုခဲ့သည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။
ဖလဲ့စည်သပုံဆိုင်ရာ တူညီမဟု အညလဟန်သကိန်သ နဟိုင်သယဟဉ်မဟု (SSIM)။ မဌင့်မာသသောတန်ဖိုသမျာသသည် မူရင်သနဟင့် ပိုမိုကောင်သမလန်သော ဆင်တူကဌောင်သကို ဖော်ပဌသည်။ Bold type သည် စာရေသဆရာမျာသ၏ အလုပ်ရလဒ်ကို ညလဟန်ပဌသည်။

ကောက်ချက်

ရုပ်ပုံချုံ့ခဌင်သအတလက် နက်နဲသောသင်ယူမဟုကို အသုံသပဌုရန် နည်သလမ်သအသစ်ကို ကျလန်ုပ်တို့ကဌည့်ရဟုခဲ့ပဌီသ၊ ရုပ်ပုံအမျိုသအစာသခလဲခဌာသခဌင်သနဟင့် ဘာသာစကာသလုပ်ဆောင်ခဌင်သကဲ့သို့သော "ယေဘူယျ" အလုပ်မျာသအပဌင် အလုပ်မျာသတလင် အာရုံကဌောကလန်ရက်မျာသကို အသုံသပဌုခဌင်သဖဌစ်နိုင်ခဌေအကဌောင်သ ဆလေသနလေသခဲ့ကဌသည်။ ကနည်သလမ်သသည် ခေတ်မီလိုအပ်ချက်မျာသထက် နိမ့်ကျရုံသာမက ပုံမျာသကို ပိုမိုမဌန်ဆန်စလာ လုပ်ဆောင်နိုင်စေပါသည်။

ကျလန်ုပ်တို့သည် အထူသသဖဌင့် Habravchan အတလက် ပရိုမိုကုဒ်တစ်ခု ပဌုလုပ်ထာသသောကဌောင့် အာရုံကဌောကလန်ရက်မျာသကို သင်ယူခဌင်သသည် ပိုမိုလလယ်ကူလာပါသည်။ HABRနဖူသစည်သတလင် ဖော်ပဌထာသသည့် လျဟော့စျေသသို့ အပို 10% လျဟော့စျေသကို ပေသသည်။

ပုံမျာသကို ချုံ့ရန် AI ကို အသုံသပဌုခဌင်သ။

နောက်ထပ်သင်တန်သမျာသ

အထူသအသာသပေသ ဆောင်သပါသမျာသ

source: www.habr.com

မဟတ်ချက် Add