د شپې په عکسونو کې د عکس ترکیب او شور کمولو لپاره د ماشین زده کړې سیسټمونه

ثبات AI د مستحکم ډیفیوژن ماشین زده کړې سیسټم لپاره چمتو شوي ماډلونه خپاره کړي چې په طبیعي ژبه کې د متن توضیحاتو پراساس د عکسونو ترکیب او ترمیم کولو وړتیا لري. موډلونه د سوداګریزې کارونې لپاره د اجازې تخلیقي ML OpenRAIL-M جواز لاندې جواز لري. د سیسټم د روزنې لپاره، د 4000 NVIDIA A100 Ezra-1 GPUs کلستر او د LAION-5B ټولګه، د متن توضیحاتو سره د 5.85 ملیارد عکسونو په ګډون، کارول شوي. پخوا، د عصبي شبکې روزنې او د عکسونو تولید لپاره د وسیلو کوډ د MIT جواز لاندې خلاص سرچینه و.

د چمتو شوي ماډل شتون او په کافي اندازه د سیسټم اړتیاوې چې یو ته اجازه ورکوي په کمپیوټر کې د معیاري GPUs سره تجربې پیل کړي د یو شمیر اړوندو پروژو رامینځته کیدو لامل شوي:

  • متن-انورژن (کوډ) - یو اضافه کول چې تاسو ته اجازه درکوي د ورکړل شوي کرکټر ، څیز یا سټایل سره عکسونه ترکیب کړئ. په اصلي مستحکم خپریدو کې، په ترکیب شوي انځورونو کې شیان تصادفي او د کنټرول وړ ندي. وړاندیز شوی اضافه تاسو ته اجازه درکوي خپل لید توکي اضافه کړئ ، کلیدي کلمو سره یې وتړئ او په ترکیب کې یې وکاروئ.

    د مثال په توګه ، په منظم مستحکم خپریدو کې تاسو کولی شئ له سیسټم څخه وغواړئ چې د "کشتۍ کې پیشو" سره عکس رامینځته کړي. برسیره پردې، تاسو کولی شئ د پیشو او کښتۍ ځانګړتیاوې روښانه کړئ، مګر دا غیر متوقعه ده چې کوم پیشو او کښتۍ به ترکیب شي. متن - انعطاف تاسو ته اجازه درکوي سیسټم ستاسو د پیشو یا کښتۍ په عکس کې وروزي او عکس د ځانګړي پیشو یا کښتۍ سره ترکیب کړئ. په ورته ډول، دا کولی شي د عکس عناصر د ځانګړو شیانو سره بدل کړي، د ترکیب لپاره د بصری سټایل مثال وټاکي، او مفکورې مشخص کړي (د بیلګې په توګه، د ډاکټرانو د ټولو ډولونو څخه، تاسو کولی شئ د ډیر درست او لوړ کیفیت انتخاب وکاروئ. په مطلوب سټایل کې).

    د شپې په عکسونو کې د عکس ترکیب او شور کمولو لپاره د ماشین زده کړې سیسټمونه

  • stable-diffusion-animation - د متحرک (حرکت) عکسونو رامینځته کول د عکسونو ترمینځ د مداخلې پراساس په مستحکم خپریدو کې رامینځته شوي.
  • stable_diffusion.openvino (کوډ) - د مستحکم خپریدو بندر، کوم چې یوازې CPU د محاسبې لپاره کاروي، کوم چې د ځواکمنو GPUs پرته په سیسټمونو کې تجربې ته اجازه ورکوي. د OpenVINO کتابتون کې ملاتړ شوي پروسیسر ته اړتیا لري. په رسمي ډول، OpenVINO د AVX2، AVX-512، AVX512_BF16 او SSE توسیعونو سره د Intel پروسیسرونو لپاره فلګ ان چمتو کوي، او همدارنګه د Raspberry Pi 4 ماډل B، Apple Mac mini او NVIDIA Jetson نانو بورډونو لپاره. په غیر رسمي ډول ، دا امکان لري چې د AMD Ryzen پروسیسرونو کې OpenVINO وکاروئ.
  • sdamd د AMD GPUs لپاره بندر دی.
  • د ویډیو ترکیب لومړنی تطبیق.
  • stable-diffusion-gui, stable-diffusion-ui, Artbreeder Collage, Disfuse-the-Rest - د مستحکم خپریدو په کارولو سره د عکسونو رامینځته کولو لپاره ګرافیکي انٹرفیسونه.
  • beta.dreamstudio.ai، د مخ ځړولو ځایونه، hlky Stable Diffusion WebUI - د سټیبل ډیفیوژن په کارولو سره د عکس ترکیب لپاره ویب انٹرفیسونه.
  • د GIMP، فګما، بلینډر او فوټوشاپ سره د مستحکم ډیفیوژن ادغام لپاره پلگ ان.

برسیره پردې، موږ کولی شو د ګوګل لخوا د RawNeRF (RAW Neural Radiance Fields) د ماشین زده کړې سیسټم د کوډ خپرونه یادونه وکړو، کوم چې د ډیری RAW انځورونو څخه د معلوماتو پراساس، په تیاره او تیاره کې اخیستل شوي خورا شور لرونکي عکسونو کیفیت ته وده ورکوي. ضعیف رڼا د شور له مینځه وړلو سربیره ، د پروژې لخوا رامینځته شوي وسیلې دا امکان ورکوي چې توضیحات ډیر کړي ، چمک له مینځه یوسي ، HDR ترکیب کړي او په عکسونو کې عمومي ر lightingا بدل کړي ، په بیله بیا د مختلف زاویو څخه د څو عکسونو په کارولو سره د شیانو درې اړخیز موقعیت بیا جوړ کړي. د لید نقطه بدل کړئ، تمرکز سمبال کړئ او خوځنده عکسونه تولید کړئ.

د شپې په عکسونو کې د عکس ترکیب او شور کمولو لپاره د ماشین زده کړې سیسټمونه
د شپې په عکسونو کې د عکس ترکیب او شور کمولو لپاره د ماشین زده کړې سیسټمونه


سرچینه: opennet.ru

Add a comment