اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو

Stability AI Stable Diffusion مشين لرننگ سسٽم جو ٻيو ايڊيشن شايع ڪيو آهي، جيڪو تجويز ڪيل ٽيمپليٽ يا قدرتي ٻولي جي متن جي وضاحت جي بنياد تي تصويرن کي ترتيب ڏيڻ ۽ تبديل ڪرڻ جي قابل آهي. ٽولز جو ڪوڊ نيورل نيٽ ورڪ ٽريننگ ۽ تصويري پيداوار لاءِ Python ۾ PyTorch فريم ورڪ استعمال ڪندي لکيو ويو آهي ۽ MIT لائسنس تحت شايع ڪيو ويو آهي. اڳ ۾ ئي تربيت يافته ماڊل کليل آهن تخليقي ML OpenRAIL-M اجازت واري لائسنس تحت، جيڪي تجارتي استعمال جي اجازت ڏين ٿيون. اضافي طور تي، هڪ ڊيمو آن لائن تصوير جنريٽر موجود آهي.

Stable Diffusion جي نئين ايڊيشن ۾ اهم سڌارا:

  • متن جي وضاحت جي بنياد تي تصويري جوڙجڪ لاءِ هڪ نئون ماڊل — SD2.0-v — ٺاهيو ويو آهي، جيڪو 768×768 جي ريزوليوشن سان تصويرن جي نسل کي سپورٽ ڪري ٿو. نئين ماڊل کي 5 بلين تصويرن جي LAION-5.85B مجموعي کي استعمال ڪندي تربيت ڏني وئي متن جي وضاحت سان. ماڊل استعمال ڪري ٿو ساڳيو پيٽرولر جو سيٽ Stable Diffusion 1.5 ماڊل، پر بنيادي طور تي مختلف OpenCLIP-ViT/H انڪوڊر استعمال ڪرڻ جي منتقلي کان مختلف آهي، جنهن اهو ممڪن ڪيو ته نتيجن جي تصويرن جي معيار کي بهتر طور تي بهتر بڻائي.
    اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو
  • ھڪڙو آسان ٿيل SD2.0-بنيادي ورزن تيار ڪيو ويو آھي، 256×256 تصويرن تي تربيت ڪئي وئي آھي ڪلاسيڪل شور جي اڳڪٿي واري ماڊل کي استعمال ڪندي ۽ 512×512 جي ريزوليوشن سان تصويري نسل کي سپورٽ ڪندي.
    اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو
  • سپر نموني (سپر ريزوليوشن) جي ٽيڪنالاجي کي استعمال ڪرڻ جو امڪان مهيا ڪيو ويو آهي اصل تصوير جي ريزوليوشن کي وڌائڻ لاءِ معيار کي گھٽائڻ، اسپيشل اسڪيلنگ ۽ تفصيلن جي تعمير لاءِ الگورٿم استعمال ڪندي. مهيا ڪيل تصويري پروسيسنگ ماڊل (SD20-upscaler) 2048x اپ اسڪيلنگ کي سپورٽ ڪري ٿو، جيڪا 2048 × XNUMX جي ريزوليوشن سان تصويرون ٺاهي سگھي ٿي.
    اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو
  • SD2.0-depth2img ماڊل پيش ڪيو ويو آهي، جيڪو شيون جي کوٽائي ۽ فضائي ترتيب کي حساب ۾ رکي ٿو. MiDaS سسٽم monocular کوٽائي جي تخميني لاء استعمال ڪيو ويندو آهي. ماڊل توهان کي نئين تصويرن کي گڏ ڪرڻ جي اجازت ڏئي ٿو ٻي تصوير کي ٽيمپليٽ جي طور تي استعمال ڪندي، جيڪا بنيادي طور تي اصل کان مختلف ٿي سگهي ٿي، پر مجموعي ساخت ۽ کوٽائي کي برقرار رکي. مثال طور، توهان هڪ تصوير ۾ هڪ شخص جي پوز استعمال ڪري سگهو ٿا ساڳئي پوز ۾ ٻيو ڪردار ٺاهي.
    اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو
    اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو
    اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو
  • تصويرن کي تبديل ڪرڻ جو ماڊل اپڊيٽ ڪيو ويو آهي - SD 2.0-inpainting، جيڪو توهان کي متن جي اشارن کي استعمال ڪندي تصوير جي حصن کي تبديل ڪرڻ ۽ تبديل ڪرڻ جي اجازت ڏئي ٿو.
    اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو
  • ماڊلز کي هڪ GPU سان روايتي سسٽم تي استعمال لاءِ بهتر ڪيو ويو آهي.

اسٽيبل ڊفيوشن 2.0 تصويري سنٿيسس سسٽم متعارف ڪرايو


جو ذريعو: opennet.ru

تبصرو شامل ڪريو