مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔

Stability AI نے Stable Diffusion مشین لرننگ سسٹم کا دوسرا ایڈیشن شائع کیا ہے، جو مجوزہ ٹیمپلیٹ یا قدرتی زبان کے متن کی تفصیل کی بنیاد پر تصاویر کی ترکیب اور ترمیم کرنے کے قابل ہے۔ نیورل نیٹ ورک ٹریننگ اور امیج جنریشن ٹولز کا کوڈ PyTorch فریم ورک کا استعمال کرتے ہوئے Python میں لکھا گیا ہے اور MIT لائسنس کے تحت شائع کیا گیا ہے۔ پہلے سے تربیت یافتہ ماڈل اجازت نامہ تخلیقی ML OpenRAIL-M لائسنس کے تحت کھلے ہیں، تجارتی استعمال کی اجازت دیتے ہیں۔ مزید برآں، ایک ڈیمو آن لائن امیج جنریٹر دستیاب ہے۔

مستحکم بازی کے نئے ایڈیشن میں کلیدی بہتری:

  • متن کی تفصیل پر مبنی تصویری ترکیب کے لیے ایک نیا ماڈل بنایا گیا ہے - SD2.0-v، جو کہ 768x768 کے ریزولوشن کے ساتھ تصاویر کی تخلیق کو سپورٹ کرتا ہے۔ نئے ماڈل کو LAION-5B مجموعہ کا استعمال کرتے ہوئے تربیت دی گئی ہے، جس میں متن کی تفصیل کے ساتھ 5.85 بلین تصاویر شامل ہیں۔ ماڈل پیرامیٹرس کے وہی سیٹ استعمال کرتا ہے جیسا کہ Stable Diffusion 1.5 ماڈل، لیکن بنیادی طور پر مختلف OpenCLIP-ViT/H انکوڈر کے استعمال کی منتقلی میں مختلف ہے، جس نے نتیجے میں آنے والی تصاویر کے معیار کو نمایاں طور پر بہتر کیا ہے۔
    مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔
  • SD2.0-base کا ایک آسان ورژن تیار کیا گیا ہے، جسے کلاسیکی شور کی پیشین گوئی کے ماڈل کا استعمال کرتے ہوئے 256×256 امیجز پر تربیت دی گئی ہے اور 512×512 کی ریزولوشن کے ساتھ امیجز کی جنریشن کو سپورٹ کیا گیا ہے۔
    مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔
  • مقامی اسکیلنگ اور ڈیٹیل ری کنسٹرکشن الگورتھم کا استعمال کرتے ہوئے معیار کو کم کیے بغیر اصل تصویر کی ریزولوشن کو بڑھانے کے لیے سپر سیمپلنگ ٹیکنالوجی (سپر ریزولوشن) کا استعمال ممکن ہے۔ فراہم کردہ امیج پروسیسنگ ماڈل (SD20-upscaler) چار بار زوم کو سپورٹ کرتا ہے، جو 2048x2048 کی ریزولوشن کے ساتھ تصاویر کی تخلیق کی اجازت دیتا ہے۔
    مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔
  • اشیاء کی گہرائی اور مقامی ترتیب کو مدنظر رکھتے ہوئے SD2.0-depth2img ماڈل تجویز کیا گیا ہے۔ مونوکولر گہرائی کے تخمینے کے لیے، MiDaS سسٹم استعمال کیا جاتا ہے۔ ماڈل آپ کو ٹیمپلیٹ کے بطور دوسری تصویر کا استعمال کرتے ہوئے نئی تصاویر کی ترکیب کرنے کی اجازت دیتا ہے، جو اصل سے یکسر مختلف ہو سکتی ہے، لیکن مجموعی ساخت اور گہرائی کو برقرار رکھتی ہے۔ مثال کے طور پر، آپ تصویر میں کسی شخص کے پوز کو اسی پوز میں ایک اور کردار بنانے کے لیے استعمال کر سکتے ہیں۔
    مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔
    مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔
    مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔
  • تصاویر میں ترمیم کرنے کے ماڈل کو اپ ڈیٹ کر دیا گیا ہے - SD 2.0-inpainting، جو آپ کو متن کے اشارے کا استعمال کرتے ہوئے تصویر کے حصوں کو تبدیل کرنے اور تبدیل کرنے کی اجازت دیتا ہے۔
    مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔
  • ماڈلز کو ایک ہی GPU کے ساتھ روایتی سسٹمز پر استعمال کے لیے بہتر بنایا گیا ہے۔

مستحکم بازی 2.0 تصویری ترکیب کا نظام متعارف کرایا گیا۔


ماخذ: opennet.ru

نیا تبصرہ شامل کریں