Stability AI በተፈጥሮ ቋንቋ የጽሁፍ መግለጫ ላይ ተመስርተው ምስሎችን ማዋሃድ እና ማስተካከል የሚችሉ ለStable Diffusion ማሽን መማሪያ ስርዓት ዝግጁ የሆኑ ሞዴሎችን አሳትሟል። ሞዴሎች ለንግድ አገልግሎት በሚፈቀደው የ Creative ML OpenRAIL-M ፍቃድ ፈቃድ ተሰጥቷቸዋል። ስርዓቱን ለማሰልጠን 4000 NVIDIA A100 Esra-1 GPUs እና LAION-5B ስብስብ 5.85 ቢሊዮን ምስሎችን ከጽሑፍ መግለጫዎች ጋር በማያያዝ ጥቅም ላይ ውሏል። ቀደም ሲል የነርቭ ኔትወርክን ለማሰልጠን እና ምስሎችን ለማመንጨት የሚረዱ መሳሪያዎች ኮድ በ MIT ፈቃድ ስር ነበር.
አንድ ዝግጁ-የተሰራ ሞዴል እና መጠነኛ የስርዓት መስፈርቶች አንድ ሰው በመደበኛ ጂፒዩዎች በፒሲ ላይ ሙከራዎችን እንዲጀምር የሚያስችላቸው መኖሩ በርካታ ተዛማጅ ፕሮጀክቶች እንዲፈጠሩ ምክንያት ሆኗል፡
- ጽሑፋዊ-ተገላቢጦሽ (ኮድ) - ምስሎችን በተሰጠ ገጸ-ባህሪ ፣ ነገር ወይም ዘይቤ ለማዋሃድ የሚያስችል ተጨማሪ። በመነሻው የተረጋጋ ስርጭት ውስጥ, በተቀነባበሩ ምስሎች ውስጥ ያሉት ነገሮች በዘፈቀደ እና ከቁጥጥር ውጭ ናቸው. የታቀደው ተጨማሪ የእራስዎን ምስላዊ ነገሮች እንዲያክሉ፣ በቁልፍ ቃላቶች ላይ እንዲያስሩዋቸው እና በማዋሃድ ውስጥ እንዲጠቀሙ ይፈቅድልዎታል።
ለምሳሌ, በመደበኛው የተረጋጋ ስርጭት ውስጥ ስርዓቱን "ድመት በጀልባ" ምስል እንዲያመነጭ መጠየቅ ይችላሉ. በተጨማሪም, የድመት እና የጀልባውን ባህሪያት ግልጽ ማድረግ ይችላሉ, ነገር ግን የትኛው ድመት እና ጀልባ እንደሚዋሃዱ የማይታወቅ ነው. ጽሑፋዊ-ተገላቢጦሽ ስርዓቱን በድመትዎ ወይም በጀልባዎ ምስል ላይ ለማሰልጠን እና ምስሉን ከተወሰነ ድመት ወይም ጀልባ ጋር ለማዋሃድ ያስችልዎታል። በተመሳሳይ መልኩ የምስል ክፍሎችን በተወሰኑ ነገሮች መተካት ፣ ለውህደት የእይታ ዘይቤን ምሳሌ ማዘጋጀት እና ፅንሰ-ሀሳቦችን መግለጽ ይችላል (ለምሳሌ ፣ ከተለያዩ ሐኪሞች ፣ የበለጠ ትክክለኛ እና ከፍተኛ ጥራት ያለው ምርጫን መጠቀም ይችላሉ) በሚፈለገው ዘይቤ).

- የተረጋጋ-ስርጭት-አኒሜሽን - በተረጋጋ ስርጭት ውስጥ በተፈጠሩ ስዕሎች መካከል ባለው መስተጋብር ላይ በመመስረት የታነሙ (ተንቀሳቃሽ) ምስሎች መፍጠር።
- stable_diffusion.openvino (code) - ጠንካራ ጂፒዩዎች በሌሉበት ሲስተሞች ላይ ሙከራዎችን የሚፈቅደው የተረጋጋ ስርጭት ወደብ፣ ሲፒዩን ለስሌቶች ብቻ የሚጠቀም። በOpenVINO ቤተ-መጽሐፍት ውስጥ የሚደገፍ ፕሮሰሰር ያስፈልገዋል። በይፋ ኦፕንቪኖ ለኢንቴል ፕሮሰሰር በAVX2፣ AVX-512፣ AVX512_BF16 እና SSE ቅጥያዎች እንዲሁም Raspberry Pi 4 Model B፣ Apple Mac mini እና NVIDIA Jetson Nano ቦርዶችን ያቀርባል። በይፋዊ ባልሆነ መንገድ በ AMD Ryzen ፕሮሰሰር ላይ OpenVINOን መጠቀም ይቻላል።
- sdamd የ AMD ጂፒዩዎች ወደብ ነው።
- የቪዲዮ ውህደት የመጀመሪያ ትግበራ።
- stable-diffusion-gui፣ stable-diffusion-ui፣ Artbreeder Collage፣ diffuse-the-ቀሪው - የተረጋጋ ስርጭትን በመጠቀም ምስሎችን ለማመንጨት ስዕላዊ በይነገጽ።
- beta.dreamstudio.ai፣ መተቃቀፍ የፊት ክፍተቶች፣ hlky የተረጋጋ ስርጭት WebUI - የተረጋጋ ስርጭትን በመጠቀም ለምስል ውህደት የድር በይነገጽ።
- የተረጋጋ ስርጭትን ከGIMP፣ Figma፣ Blender እና Photoshop ጋር ለማዋሃድ ተሰኪዎች።
በተጨማሪም፣ ከበርካታ RAW ምስሎች ላይ በተገኘው መረጃ ላይ በመመርኮዝ፣ በጨለማ እና በ ውስጥ የተወሰዱ ከፍተኛ ጫጫታ ምስሎችን ጥራት ለማሻሻል የሚያስችል የ RawNeRF (RAW Neural Radiance Fields) የማሽን መማሪያ ስርዓት ኮድ በ Google መታተም እንችላለን። ደካማ ብርሃን. ጩኸትን ከማስወገድ በተጨማሪ በፕሮጀክቱ የተገነቡ መሳሪያዎች ዝርዝር ሁኔታን ለመጨመር, ነጸብራቅን ለማስወገድ, ኤችዲአርን ለማዋሃድ እና በፎቶግራፎች ውስጥ ያለውን አጠቃላይ ብርሃን ለመለወጥ, እንዲሁም የነገሮችን ሶስት አቅጣጫዊ አቀማመጥ በተለያዩ አቅጣጫዎች ለመፍጠር ያስችላሉ. የአመለካከትን ነጥብ መቀየር, ትኩረትን መቆጣጠር እና ተንቀሳቃሽ ምስሎችን ማፍለቅ.




ምንጭ: opennet.ru

