ثبات AI د مستحکم ډیفیوژن ماشین زده کړې سیسټم لپاره چمتو شوي ماډلونه خپاره کړي چې په طبیعي ژبه کې د متن توضیحاتو پراساس د عکسونو ترکیب او ترمیم کولو وړتیا لري. موډلونه د سوداګریزې کارونې لپاره د اجازې تخلیقي ML OpenRAIL-M جواز لاندې جواز لري. د سیسټم د روزنې لپاره، د 4000 NVIDIA A100 Ezra-1 GPUs کلستر او د LAION-5B ټولګه، د متن توضیحاتو سره د 5.85 ملیارد عکسونو په ګډون، کارول شوي. پخوا، د عصبي شبکې روزنې او د عکسونو تولید لپاره د وسیلو کوډ د MIT جواز لاندې خلاص سرچینه و.
د چمتو شوي ماډل شتون او په کافي اندازه د سیسټم اړتیاوې چې یو ته اجازه ورکوي په کمپیوټر کې د معیاري GPUs سره تجربې پیل کړي د یو شمیر اړوندو پروژو رامینځته کیدو لامل شوي:
- متن-انورژن (کوډ) - یو اضافه کول چې تاسو ته اجازه درکوي د ورکړل شوي کرکټر ، څیز یا سټایل سره عکسونه ترکیب کړئ. په اصلي مستحکم خپریدو کې، په ترکیب شوي انځورونو کې شیان تصادفي او د کنټرول وړ ندي. وړاندیز شوی اضافه تاسو ته اجازه درکوي خپل لید توکي اضافه کړئ ، کلیدي کلمو سره یې وتړئ او په ترکیب کې یې وکاروئ.
د مثال په توګه ، په منظم مستحکم خپریدو کې تاسو کولی شئ له سیسټم څخه وغواړئ چې د "کشتۍ کې پیشو" سره عکس رامینځته کړي. برسیره پردې، تاسو کولی شئ د پیشو او کښتۍ ځانګړتیاوې روښانه کړئ، مګر دا غیر متوقعه ده چې کوم پیشو او کښتۍ به ترکیب شي. متن - انعطاف تاسو ته اجازه درکوي سیسټم ستاسو د پیشو یا کښتۍ په عکس کې وروزي او عکس د ځانګړي پیشو یا کښتۍ سره ترکیب کړئ. په ورته ډول، دا کولی شي د عکس عناصر د ځانګړو شیانو سره بدل کړي، د ترکیب لپاره د بصری سټایل مثال وټاکي، او مفکورې مشخص کړي (د بیلګې په توګه، د ډاکټرانو د ټولو ډولونو څخه، تاسو کولی شئ د ډیر درست او لوړ کیفیت انتخاب وکاروئ. په مطلوب سټایل کې).
- stable-diffusion-animation - د متحرک (حرکت) عکسونو رامینځته کول د عکسونو ترمینځ د مداخلې پراساس په مستحکم خپریدو کې رامینځته شوي.
- stable_diffusion.openvino (کوډ) - د مستحکم خپریدو بندر، کوم چې یوازې CPU د محاسبې لپاره کاروي، کوم چې د ځواکمنو GPUs پرته په سیسټمونو کې تجربې ته اجازه ورکوي. د OpenVINO کتابتون کې ملاتړ شوي پروسیسر ته اړتیا لري. په رسمي ډول، OpenVINO د AVX2، AVX-512، AVX512_BF16 او SSE توسیعونو سره د Intel پروسیسرونو لپاره فلګ ان چمتو کوي، او همدارنګه د Raspberry Pi 4 ماډل B، Apple Mac mini او NVIDIA Jetson نانو بورډونو لپاره. په غیر رسمي ډول ، دا امکان لري چې د AMD Ryzen پروسیسرونو کې OpenVINO وکاروئ.
- sdamd د AMD GPUs لپاره بندر دی.
- د ویډیو ترکیب لومړنی تطبیق.
- stable-diffusion-gui, stable-diffusion-ui, Artbreeder Collage, Disfuse-the-Rest - د مستحکم خپریدو په کارولو سره د عکسونو رامینځته کولو لپاره ګرافیکي انٹرفیسونه.
- beta.dreamstudio.ai، د مخ ځړولو ځایونه، hlky Stable Diffusion WebUI - د سټیبل ډیفیوژن په کارولو سره د عکس ترکیب لپاره ویب انٹرفیسونه.
- د GIMP، فګما، بلینډر او فوټوشاپ سره د مستحکم ډیفیوژن ادغام لپاره پلگ ان.
برسیره پردې، موږ کولی شو د ګوګل لخوا د RawNeRF (RAW Neural Radiance Fields) د ماشین زده کړې سیسټم د کوډ خپرونه یادونه وکړو، کوم چې د ډیری RAW انځورونو څخه د معلوماتو پراساس، په تیاره او تیاره کې اخیستل شوي خورا شور لرونکي عکسونو کیفیت ته وده ورکوي. ضعیف رڼا د شور له مینځه وړلو سربیره ، د پروژې لخوا رامینځته شوي وسیلې دا امکان ورکوي چې توضیحات ډیر کړي ، چمک له مینځه یوسي ، HDR ترکیب کړي او په عکسونو کې عمومي ر lightingا بدل کړي ، په بیله بیا د مختلف زاویو څخه د څو عکسونو په کارولو سره د شیانو درې اړخیز موقعیت بیا جوړ کړي. د لید نقطه بدل کړئ، تمرکز سمبال کړئ او خوځنده عکسونه تولید کړئ.
سرچینه: opennet.ru