የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።

Stability AI በተጠቆመ አብነት ወይም የተፈጥሮ ቋንቋ የፅሁፍ መግለጫ ላይ በመመስረት ምስሎችን ማቀናበር እና ማስተካከል የሚችል የStable Diffusion ማሽን መማሪያ ስርዓት ሁለተኛውን እትም አሳትሟል። ለነርቭ አውታረመረብ ማሰልጠኛ እና ምስል ማመንጨት የመሳሪያዎች ኮድ ፒቶርች ማዕቀፍን በመጠቀም በፓይዘን ተጽፎ በ MIT ፈቃድ ታትሟል። ቀድሞውንም የሰለጠኑ ሞዴሎች ለንግድ አገልግሎት በሚፈቅደው በCreative ML OpenRAIL-M የተፈቀደ ፈቃድ ስር ተከፍተዋል። በተጨማሪም፣ ማሳያ የመስመር ላይ ምስል ጀነሬተር አለ።

በአዲሱ የStable Diffusion እትም ውስጥ ቁልፍ ማሻሻያዎች፡-

  • በጽሑፍ መግለጫ ላይ የተመሠረተ አዲስ የምስል ውህደት ሞዴል ተፈጥሯል - ኤስዲ2.0-ቪ - ተፈጥሯል ይህም ምስሎችን በ 768 × 768 ጥራት ማመንጨትን ይደግፋል። አዲሱ ሞዴል የ LAION-5B ስብስብ የ 5.85 ቢሊየን ምስሎችን ከጽሑፍ መግለጫዎች ጋር በመጠቀም የሰለጠኑ ናቸው። ሞዴሉ ከStable Diffusion 1.5 ሞዴል ጋር ተመሳሳይ የመለኪያዎች ስብስብ ይጠቀማል፣ ነገር ግን በመሠረታዊነት የተለየ የOpenCLIP-ViT/H ኢንኮደር በመጠቀም ወደ ሽግግር ይለያያል፣ ይህም የተገኙትን ምስሎች ጥራት በእጅጉ ለማሻሻል አስችሏል።
    የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።
  • በ2.0×256 ምስሎች ላይ የሰለጠነ ቀለል ያለ ኤስዲ256-ቤዝ ተዘጋጅቷል።
    የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።
  • የሱፐር ናሙና (Super Resolution) ቴክኖሎጂን የመጠቀም እድሉ ጥራቱን ሳይቀንስ የመነሻውን ምስል ጥራት ለመጨመር ስልተ ቀመሮችን በመጠቀም የቦታ መለካት እና ዝርዝሮችን እንደገና መገንባት ይሰጣል። የቀረበው የምስል ማቀናበሪያ ሞዴል (SD20-upscaler) 2048x upscaling ይደግፋል፣ ይህም ምስሎችን በ2048×XNUMX ጥራት ማመንጨት ይችላል።
    የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።
  • የ SD2.0-depth2img ሞዴል ቀርቧል፣ ይህም የነገሮችን ጥልቀት እና የቦታ አቀማመጥ ግምት ውስጥ ያስገባ ነው። የ MiDaS ስርዓት ለሞኖኩላር ጥልቀት ግምት ጥቅም ላይ ይውላል. ሞዴሉ ሌላ ምስል እንደ አብነት በመጠቀም አዳዲስ ምስሎችን እንዲያዋህዱ ይፈቅድልዎታል, ይህም ከመጀመሪያው በጣም የተለየ ሊሆን ይችላል, ነገር ግን አጠቃላይ ስብጥር እና ጥልቀት ይይዛል. ለምሳሌ የአንድን ሰው አቀማመጥ በፎቶ ላይ በመጠቀም ሌላ ገፀ ባህሪን በተመሳሳይ አቀማመጥ መፍጠር ይችላሉ።
    የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።
    የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።
    የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።
  • ምስሎችን የመቀየር ሞዴል ተዘምኗል - SD 2.0-inpainting፣ ይህም የጽሑፍ ጥያቄዎችን በመጠቀም የምስል ክፍሎችን ለመተካት እና ለመለወጥ የሚያስችል ነው።
    የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።
  • ሞዴሎች በአንድ ጂፒዩ በተለመዱ ስርዓቶች ላይ ጥቅም ላይ እንዲውሉ ተመቻችተዋል።

የተረጋጋ ስርጭት 2.0 የምስል ውህደት ስርዓት ገብቷል።


ምንጭ: opennet.ru

አስተያየት ያክሉ