ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
እንደ ነርቭ ኔትወርኮች ያሉ በመረጃ የተደገፉ ስልተ ቀመሮች ዓለምን በማዕበል ወስደዋል። እድገታቸው ርካሽ እና ኃይለኛ መሳሪያዎችን እና ከፍተኛ መጠን ያለው መረጃን ጨምሮ በበርካታ ምክንያቶች የተነሳ ነው. የነርቭ ኔትወርኮች በአሁኑ ጊዜ ከ "ኮግኒቲቭ" ተግባራት እንደ ምስል ማወቂያ, የተፈጥሮ ቋንቋ መረዳት, ወዘተ ካሉ ሁሉም ነገሮች ግንባር ቀደም ናቸው. ነገር ግን በእንደዚህ አይነት ስራዎች ብቻ መወሰን የለባቸውም. ይህ ጽሑፍ ቀሪ ትምህርትን በመጠቀም የነርቭ ኔትወርኮችን በመጠቀም ምስሎችን እንዴት መጭመቅ እንደሚቻል ይናገራል። በአንቀጹ ውስጥ የቀረበው አቀራረብ ከመደበኛ ኮዴኮች የበለጠ ፈጣን እና የተሻለ ነው። መርሃግብሮች, እኩልታዎች እና, በእርግጠኝነት, በቆራጩ ስር ሙከራዎች ያሉት ጠረጴዛ.

ይህ ጽሑፍ የተመሰረተው ይሄ ሥራ ። የነርቭ አውታረ መረቦችን እና ጽንሰ-ሀሳቦቻቸውን በደንብ ያውቃሉ ተብሎ ይታሰባል። convolution и የመጥፋት ተግባር.

የምስል መጨናነቅ ምንድነው እና እንዴት ነው የሚሰራው?

የምስል መጨናነቅ ትንሽ ቦታ እንዲይዝ ምስልን የመቀየር ሂደት ነው። ምስሎችን በቀላሉ ማከማቸት ብዙ ቦታ ይወስዳል፣ ለዚህም ነው የመጀመሪያውን ምስል መጠን ለመቀነስ እንደ JPEG እና PNG ያሉ ኮዴኮች ያሉት።

እንደሚያውቁት፣ ሁለት ዓይነት የምስል መጨመሪያ ዓይነቶች አሉ፡- ምንም ኪሳራ የለም и ከኪሳራ ጋር. ስሞቹ እንደሚጠቁሙት፣ ኪሳራ የሌለው መጭመቅ ዋናውን የምስል ዳታ ማቆየት ይችላል፣ ነገር ግን ኪሳራ የሌለው መጭመቅ አንዳንድ መረጃዎችን በማመቅ ጊዜ ያጣል። ለምሳሌ, JPG ኪሳራ ስልተ ቀመሮች ናቸው [በግምት. ትርጉም - በመሠረቱ፣ ስለ ኪሳራ የሌለው JPEG] መርሳት የለብንም ፣ እና PNG ኪሳራ የሌለው ስልተ ቀመር ነው።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ኪሳራ የሌለው እና ኪሳራ የሌለው መጨናነቅ ማነፃፀር

በቀኝ በኩል ባለው ምስል ላይ ብዙ የሚያግድ ቅርሶች እንዳሉ ልብ ይበሉ። ይህ የጠፋ መረጃ ነው። ተመሳሳይ ቀለም ያላቸው አጎራባች ፒክስሎች ቦታን ለመቆጠብ እንደ አንድ ቦታ ተጨምቀዋል፣ ነገር ግን ስለ ትክክለኛው ፒክስሎች መረጃ ጠፍቷል። እርግጥ ነው፣ በJPEG፣ PNG፣ ወዘተ. ኮዴኮች ውስጥ ጥቅም ላይ የሚውሉት ስልተ ቀመሮች በጣም የተወሳሰቡ ናቸው፣ ነገር ግን ይህ የኪሳራ መጨናነቅ ጥሩ ምሳሌ ነው። ኪሳራ የሌለው መጭመቅ ጥሩ ነው፣ ነገር ግን ኪሳራ የሌላቸው የታመቁ ፋይሎች ብዙ የዲስክ ቦታ ይወስዳሉ። ብዙ መረጃዎችን ሳያጡ ምስሎችን ለመጭመቅ የተሻሉ መንገዶች አሉ ፣ ግን እነሱ በጣም ቀርፋፋ ናቸው እና ብዙዎች ተደጋጋሚ አቀራረቦችን ይጠቀማሉ። ይህ ማለት በበርካታ ሲፒዩ ወይም ጂፒዩ ኮርሶች ላይ በትይዩ ሊሰሩ አይችሉም ማለት ነው። ይህ ገደብ በዕለት ተዕለት ጥቅም ላይ ሙሉ በሙሉ ተግባራዊ እንዳይሆኑ ያደርጋቸዋል.

Convolutional Neural Network ግብዓት

አንድ ነገር ማስላት ካስፈለገ እና ስሌቶቹ ግምታዊ ሊሆኑ ይችላሉ, ያክሉ የነርቭ አውታር. የምስል መጨናነቅን ለማሻሻል ደራሲዎቹ ትክክለኛ ደረጃውን የጠበቀ የኮንቮሉሽን የነርቭ ኔትወርክ ተጠቅመዋል። የቀረበው ዘዴ ከምርጥ መፍትሄዎች (የተሻለ ካልሆነ) ጋር እኩል ብቻ ሳይሆን, ትይዩ ኮምፒውቲንግን መጠቀም ይችላል, ይህም ወደ ከፍተኛ ፍጥነት መጨመር ያመጣል. ምክንያቱ Convolutional Neural Networks (ሲ.ኤን.ኤን) የቦታ መረጃን ከምስሎች በማውጣት ረገድ በጣም ጥሩ ናቸው፣ ከዚያም በተጠናከረ መልኩ ይቀርባሉ (ለምሳሌ የምስሉ “አስፈላጊ” ቢትስ ብቻ ተጠብቀው ይገኛሉ)። ደራሲዎቹ ምስሎቹን በተሻለ ሁኔታ ለመወከል ይህንን የሲኤንኤን ችሎታ ለመጠቀም ይፈልጋሉ።

ሥነ ሕንፃ

ደራሲዎቹ ድርብ ኔትወርክን ሐሳብ አቅርበዋል. የመጀመሪያው አውታረመረብ ምስልን እንደ ግብአት ይወስዳል እና የታመቀ ውክልና (ComCNN) ይፈጥራል። የዚህ አውታረ መረብ ውጤት በመደበኛ ኮድ (ለምሳሌ JPEG) ነው የሚሰራው። በኮዴክ ከተሰራ በኋላ ምስሉ ወደ ሁለተኛ አውታረ መረብ ተላልፏል, ይህም የመጀመሪያውን ምስል ለመመለስ በመሞከር ምስሉን ከኮዴክ "ያስተካክላል". ደራሲዎቹ ይህንን አውታረ መረብ መልሶ ግንባታ CNN (RecCNN) ብለው ሰየሙት። እንደ GANs ሁለቱም ኔትወርኮች በተደጋጋሚ የሰለጠኑ ናቸው።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ComCNN የታመቀ ውክልና ወደ መደበኛ ኮዴክ ተላልፏል

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ሪሲሲኤንኤን የኮምሲኤንኤን ውፅዓት መጠኑ ከፍ ብሏል እና ወደ RecCNN ይመገባል፣ ይህም ቀሪውን ለማወቅ ይሞክራል።

የኮዴክ ውፅዓት ወደላይ እና ከዚያ ወደ RecCNN ይተላለፋል። RecCNN ምስሉን በተቻለ መጠን ከዋናው ጋር ለማቅረብ ይሞክራል።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ከጫፍ እስከ ጫፍ የምስል መጭመቂያ ማዕቀፍ። ኮ(.) የምስል መጭመቂያ ስልተ-ቀመር ነው። ደራሲዎቹ JPEG፣ JPEG2000 እና BPG ተጠቅመዋል

የተረፈው ምንድን ነው?

ቀሪው በኮዴክ የሚፈታውን ምስል "ለማሻሻል" እንደ ድህረ-ሂደት ደረጃ ተደርጎ ሊወሰድ ይችላል። ስለ ዓለም ብዙ "መረጃ" ስላላቸው, የነርቭ አውታረመረብ ምን ማስተካከል እንዳለበት የእውቀት (ኮግኒቲቭ) ውሳኔዎችን ሊያደርግ ይችላል. ይህ ሃሳብ የተመሰረተው ቀሪ ትምህርት, ስለሚችሉት ዝርዝሮች ያንብቡ እዚህ.

የመጥፋት ተግባራት

ሁለቱ የኪሳራ ተግባራት ጥቅም ላይ የሚውሉት ሁለት የነርቭ አውታሮች ስላሉን ነው። ከእነዚህ ውስጥ የመጀመሪያው ComCNN L1 የሚል ስያሜ ተሰጥቶታል እና እንደሚከተለው ይገለጻል።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ለComCNN የማጣት ተግባር

ማብራሪያ

ይህ እኩልታ የተወሳሰበ ሊመስል ይችላል፣ ግን በትክክል መስፈርቱ ነው (ሥር አማካይ ካሬ ስህተት) MSE. ||² ማለት እነሱ ያቀፉት የቬክተር መደበኛ ማለት ነው።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ቀመር 1.1

Cr የ ComCNN ውጤትን ያመለክታል። θ የ ComCNN መለኪያዎችን መማርን ያመለክታል፣ XK የግቤት ምስል ነው።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ቀመር 1.2

Re() RecCNN ማለት ነው። ይህ እኩልታ የቀመር 1.1ን ትርጉም ወደ RecCNN በቀላሉ ያስተላልፋል። θ የ RecCNN ሊሰለጥኑ የሚችሉ መለኪያዎችን ያሳያል (ከላይ ያለው ኮፍያ ማለት መለኪያዎቹ ተስተካክለዋል)።

የሚታወቅ ፍቺ

ቀመር 1.0 ComCNN ክብደቱን እንዲቀይር ስለሚያደርግ በRecCNN ሲፈጠር የመጨረሻው ምስል በተቻለ መጠን ከግቤት ምስል ጋር ይመሳሰላል። ሁለተኛው የRecCNN ኪሳራ ተግባር በሚከተለው መልኩ ይገለጻል።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ቀመር 2.0

ማብራሪያ

እንደገና ፣ ተግባሩ የተወሳሰበ ሊመስል ይችላል ፣ ግን ይህ በአብዛኛው መደበኛ የነርቭ አውታረ መረብ ኪሳራ ተግባር (MSE) ነው።

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
ቀመር 2.1

Co() የኮዴክ ውፅዓት ማለት ነው፣ x ከላይ ኮፍያ ያለው የComCNN ውፅዓት ማለት ነው። θ2 RecCNN ሊሰለጥኑ የሚችሉ መለኪያዎች ናቸው፣ res() የRecCNN ቀሪ ውፅዓት ብቻ ነው። RecCNN በ Co () እና በግቤት ምስል መካከል ባለው ልዩነት ላይ የሰለጠነ ቢሆንም በግቤት ምስል ላይ እንዳልሆነ ልብ ሊባል የሚገባው ጉዳይ ነው.

የሚታወቅ ፍቺ

ቀመር 2.0 RecCNN ክብደቱን እንዲቀይር ያደርገዋል ስለዚህም ውጤቱ በተቻለ መጠን ከግቤት ምስል ጋር ተመሳሳይነት ይኖረዋል.

የሥልጠና መርሃ ግብር

ሞዴሎች ደጋግመው የሰለጠኑ ናቸው, እንደ GAN. የሁለተኛው ሞዴል ክብደት በሚዘመንበት ጊዜ የመጀመሪያው ሞዴል ክብደት ተስተካክሏል, ከዚያም የሁለተኛው ሞዴል ክብደት ሲሰለጥኑ ይስተካከላሉ.

ፈተናዎች

ደራሲዎቹ ቀላል ኮዴኮችን ጨምሮ ዘዴቸውን ከነባር ዘዴዎች ጋር አወዳድረው ነበር። በተገቢው ሃርድዌር ላይ ከፍተኛ ፍጥነትን በመጠበቅ የእነሱ ዘዴ ከሌሎች በተሻለ ሁኔታ ይሰራል. በተጨማሪም, ደራሲዎቹ ከሁለቱ አውታረ መረቦች ውስጥ አንዱን ብቻ ለመጠቀም ሞክረዋል እና የአፈፃፀም ውድቀትን አስተውለዋል.

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም
የመዋቅር ተመሳሳይነት መረጃ ጠቋሚ ንጽጽር (SSIM)። ከፍተኛ ዋጋዎች ከመጀመሪያው ጋር የተሻለ መመሳሰልን ያመለክታሉ. ደማቅ ዓይነት የጸሐፊዎቹን ሥራ ውጤት ያመለክታል

መደምደሚያ

ጥልቅ ትምህርትን ወደ ምስል መጨናነቅ የምንተገብርበት አዲስ መንገድ ተመልክተናል፣ እና እንደ የምስል ምደባ እና የቋንቋ ማቀናበሪያ ከመሳሰሉት "ከአጠቃላይ" በላይ በሆኑ ተግባራት ላይ የነርቭ ኔትወርኮችን የመጠቀም እድልን ተነጋገርን። ይህ ዘዴ ከዘመናዊ መስፈርቶች ያነሰ ብቻ ሳይሆን ምስሎችን በፍጥነት እንዲሰሩ ያስችልዎታል.

በተለይ ለሃብራቭቻን የማስተዋወቂያ ኮድ ስለሰራን የነርቭ ኔትወርኮችን መማር ቀላል ሆኗል። HABR, በባነር ላይ ለተጠቀሰው ቅናሽ ተጨማሪ የ 10% ቅናሽ.

ምስሎችን ከመጠን በላይ ለመጫን AI ን በመጠቀም

ተጨማሪ ኮርሶች

ተለይተው የቀረቡ ጽሑፎች

ምንጭ: hab.com

አስተያየት ያክሉ