رات جي تصويرن ۾ تصويري جوڙجڪ ۽ شور جي گھٽتائي لاءِ مشين لرننگ سسٽم

Stability AI Stable Diffusion مشين لرننگ سسٽم لاءِ تيار ٿيل ماڊل شايع ڪيا آهن، جيڪي قدرتي ٻولي ۾ متن جي وضاحت جي بنياد تي تصويرن کي ترتيب ڏيڻ ۽ تبديل ڪرڻ جي قابل آهن. ماڊلز تجارتي استعمال لاءِ اجازت ڏيندڙ تخليقي ML OpenRAIL-M لائسنس تحت لائسنس يافته آهن. سسٽم کي تربيت ڏيڻ لاءِ، 4000 NVIDIA A100 Ezra-1 GPUs جو هڪ ڪلستر ۽ LAION-5B جو مجموعو، جنهن ۾ ٽيڪسٽ وضاحتن سان گڏ 5.85 بلين تصويرون، استعمال ڪيون ويون. اڳي، ٽولز جو ڪوڊ نيورل نيٽ ورڪ کي تربيت ڏيڻ ۽ تصويرون ٺاهڻ لاءِ MIT لائسنس تحت کليل ذريعو هو.

تيار ٿيل ماڊل جي دستيابي ۽ منصفانه معمولي سسٽم گهرجون جيڪي هڪ پي سي تي معياري GPUs سان تجربا شروع ڪرڻ جي اجازت ڏين ٿيون ڪيترن ئي لاڳاپيل منصوبن جي ابھرڻ جو سبب بڻيل آهن:

  • textual-inversion (code) - ھڪڙو اضافو جيڪو توھان کي تصويرن کي ھڪڙي ڏنل ڪردار، اعتراض يا انداز سان گڏ ڪرڻ جي اجازت ڏئي ٿو. اصل Stable Diffusion ۾، ٺھيل تصويرن ۾ شيون بي ترتيب ۽ بي قابو آھن. تجويز ڪيل اضافو توهان کي توهان جي پنهنجي بصري شين کي شامل ڪرڻ جي اجازت ڏئي ٿو، انهن کي لفظن سان پابند ڪريو ۽ انهن کي ترکیب ۾ استعمال ڪريو.

    مثال طور، باقاعده Stable Diffusion ۾ توهان سسٽم کان پڇي سگهو ٿا هڪ تصوير ٺاهي "ٻيڙي ۾ ٻلي" سان. اضافي طور تي، توهان ٻلي ۽ ٻيڙيء جي خاصيتن کي واضح ڪري سگهو ٿا، پر اهو ناقابل اعتبار آهي ته ٻلي ۽ ٻيڙيء کي گڏ ڪيو ويندو. متن جي ڦيرڦار توهان کي توهان جي ٻلي يا ٻيڙيء جي تصوير تي سسٽم کي تربيت ڏيڻ ۽ تصوير کي مخصوص ٻلي يا ٻيڙيء سان گڏ ڪرڻ جي اجازت ڏئي ٿي. ساڳئي طرح، اهو پڻ تصويري عناصر کي ڪجهه شين سان تبديل ڪري سگهي ٿو، هڪ بصري انداز جو هڪ مثال ترتيب ڏيڻ لاء، ۽ تصورات کي بيان ڪري ٿو (مثال طور، ڊاڪٽرن جي سڀني قسمن مان، توهان استعمال ڪري سگهو ٿا وڌيڪ صحيح ۽ اعلي معيار جي چونڊ. مطلوب انداز ۾).

    رات جي تصويرن ۾ تصويري جوڙجڪ ۽ شور جي گھٽتائي لاءِ مشين لرننگ سسٽم

  • stable-diffusion-animation- متحرڪ (حرڪتي) تصويرن جي ٺاھڻ جي بنياد تي تصويرن جي وچ ۾ مداخلت جي بنياد تي اسٽيبل ڊفيوشن ۾ ٺاھيو ويو آھي.
  • stable_diffusion.openvino (ڪوڊ) - Stable Diffusion جو هڪ بندرگاهه، جيڪو حسابن لاءِ صرف CPU استعمال ڪري ٿو، جيڪو طاقتور GPUs کان سواءِ سسٽم تي تجربن جي اجازت ڏئي ٿو. OpenVINO لائبريري ۾ سپورٽ ٿيل پروسيسر جي ضرورت آهي. سرڪاري طور تي، OpenVINO AVX2، AVX-512، AVX512_BF16 ۽ SSE ايڪسٽينشن سان گڏ Intel پروسيسرز لاءِ پلگ ان مهيا ڪري ٿو، انهي سان گڏ Raspberry Pi 4 Model B، Apple Mac mini ۽ NVIDIA Jetson نانو بورڊز لاءِ. غير رسمي طور تي، اهو ممڪن آهي OpenVINO استعمال ڪرڻ AMD Ryzen پروسيسرز تي.
  • sdamd AMD GPUs لاءِ هڪ پورٽ آهي.
  • وڊيو سنٿيسس جو هڪ ابتدائي عمل.
  • stable-diffusion-gui, stable-diffusion-ui, Artbreeder Collage, diffuse-the-Rest- گرافڪ انٽرفيسز لاءِ اسٽيبل ڊفيوشن استعمال ڪندي تصويرون ٺاهڻ لاءِ.
  • beta.dreamstudio.ai, Hugging Face Spaces, hlky Stable Diffusion WebUI - Stable Diffusion استعمال ڪندي تصويري جوڙجڪ لاءِ ويب انٽرفيس.
  • GIMP، Figma، Blender ۽ Photoshop سان Stable Diffusion کي ضم ڪرڻ لاءِ پلگ ان.

اضافي طور تي، اسان RawNeRF (RAW Neural Radiance Fields) مشين لرننگ سسٽم جي ڪوڊ جي گوگل پاران اشاعت کي نوٽ ڪري سگھون ٿا، جيڪا اجازت ڏئي ٿي، ڪيترن ئي RAW تصويرن جي ڊيٽا جي بنياد تي، اونداهيءَ ۽ اندر ۾ کنيل انتهائي شور واري تصويرن جي معيار کي بهتر ڪرڻ لاءِ. خراب روشني. شور کي ختم ڪرڻ کان علاوه، پروجيڪٽ پاران تيار ڪيل اوزار تفصيل کي وڌائڻ، چمڪ کي ختم ڪرڻ، HDR کي ترتيب ڏيڻ ۽ تصويرن ۾ مجموعي لائٽنگ کي تبديل ڪرڻ کي ممڪن بڻائي ٿو، انهي سان گڏ مختلف زاوين کان ڪيترن ئي تصويرن کي استعمال ڪندي شين جي ٽن جہتي پوزيشن کي ٻيهر ٺاهڻ، نقطي نظر کي ڦيرايو، ڌيان کي ڦيرايو ۽ متحرڪ تصويرون ٺاھيو.

رات جي تصويرن ۾ تصويري جوڙجڪ ۽ شور جي گھٽتائي لاءِ مشين لرننگ سسٽم
رات جي تصويرن ۾ تصويري جوڙجڪ ۽ شور جي گھٽتائي لاءِ مشين لرننگ سسٽم


جو ذريعو: opennet.ru

تبصرو شامل ڪريو