تصویری ترکیب اور رات کی تصاویر میں شور کو کم کرنے کے لیے مشین لرننگ سسٹم

Stability AI نے Stable Diffusion مشین لرننگ سسٹم کے لیے ریڈی میڈ ماڈلز شائع کیے ہیں، جو قدرتی زبان میں متن کی تفصیل کی بنیاد پر تصاویر کی ترکیب اور ترمیم کرنے کے قابل ہیں۔ ماڈلز تجارتی استعمال کے لیے اجازت یافتہ تخلیقی ML OpenRAIL-M لائسنس کے تحت لائسنس یافتہ ہیں۔ سسٹم کو تربیت دینے کے لیے، 4000 NVIDIA A100 Ezra-1 GPUs کا ایک کلسٹر اور LAION-5B مجموعہ، جس میں متن کی تفصیل کے ساتھ 5.85 بلین تصاویر شامل ہیں، استعمال کی گئیں۔ پہلے، نیورل نیٹ ورک کو تربیت دینے اور تصاویر بنانے کے لیے ٹولز کا کوڈ MIT لائسنس کے تحت اوپن سورس تھا۔

ایک ریڈی میڈ ماڈل کی دستیابی اور کافی معمولی سسٹم کی ضروریات جو کسی کو معیاری GPUs کے ساتھ پی سی پر تجربات شروع کرنے کی اجازت دیتی ہیں، کئی متعلقہ پروجیکٹس کے ظہور کا باعث بنی ہیں:

  • textual-inversion (code) - ایک ایڈ آن جو آپ کو دیے گئے کردار، آبجیکٹ یا سٹائل کے ساتھ تصاویر کی ترکیب کرنے کی اجازت دیتا ہے۔ اصل مستحکم بازی میں، ترکیب شدہ امیجز میں موجود اشیاء بے ترتیب اور بے قابو ہیں۔ مجوزہ ایڈ آن آپ کو اپنی بصری اشیاء کو شامل کرنے، انہیں کلیدی الفاظ سے منسلک کرنے اور ترکیب میں استعمال کرنے کی اجازت دیتا ہے۔

    مثال کے طور پر، باقاعدہ Stable Diffusion میں آپ سسٹم سے "کشتی میں بلی" والی تصویر بنانے کے لیے کہہ سکتے ہیں۔ مزید برآں، آپ بلی اور کشتی کی خصوصیات کو واضح کر سکتے ہیں، لیکن یہ غیر متوقع ہے کہ کون سی بلی اور کشتی کی ترکیب کی جائے گی۔ متنی الٹا آپ کو اپنی بلی یا کشتی کی تصویر پر سسٹم کو تربیت دینے اور تصویر کو کسی مخصوص بلی یا کشتی کے ساتھ ترکیب کرنے کی اجازت دیتا ہے۔ اسی طرح، یہ تصویری عناصر کو بعض اشیاء سے تبدیل بھی کر سکتا ہے، ترکیب کے لیے بصری انداز کی مثال قائم کر سکتا ہے، اور تصورات کی وضاحت کر سکتا ہے (مثال کے طور پر، ڈاکٹروں کی تمام اقسام سے، آپ زیادہ درست اور اعلیٰ معیار کے انتخاب کا استعمال کر سکتے ہیں۔ مطلوبہ انداز میں)۔

    تصویری ترکیب اور رات کی تصاویر میں شور کو کم کرنے کے لیے مشین لرننگ سسٹم

  • stable-diffusion-animation - Stable Diffusion میں پیدا ہونے والی تصویروں کے درمیان انٹرپولیشن کی بنیاد پر متحرک (حرکت پذیر) تصاویر کی تخلیق۔
  • stable_diffusion.openvino (code) - Stable Diffusion کی ایک بندرگاہ، جو حساب کے لیے صرف CPU استعمال کرتی ہے، جو طاقتور GPUs کے بغیر سسٹمز پر تجربات کی اجازت دیتی ہے۔ OpenVINO لائبریری میں تعاون یافتہ پروسیسر کی ضرورت ہے۔ سرکاری طور پر، OpenVINO AVX2, AVX-512, AVX512_BF16 اور SSE ایکسٹینشنز کے ساتھ انٹیل پروسیسرز کے ساتھ ساتھ Raspberry Pi 4 Model B، Apple Mac mini اور NVIDIA Jetson Nano بورڈز کے لیے پلگ ان فراہم کرتا ہے۔ غیر سرکاری طور پر، AMD Ryzen پروسیسرز پر OpenVINO استعمال کرنا ممکن ہے۔
  • sdamd AMD GPUs کے لیے ایک پورٹ ہے۔
  • ویڈیو ترکیب کا ابتدائی نفاذ۔
  • stable-diffusion-gui, stable-diffusion-ui, Artbreeder Collage, diffuse-the-Rest - Stable Diffusion کا استعمال کرتے ہوئے تصاویر بنانے کے لیے گرافیکل انٹرفیس۔
  • beta.dreamstudio.ai، Hugging Face Spaces، hlky Stable Diffusion WebUI - Stable Diffusion کا استعمال کرتے ہوئے تصویر کی ترکیب کے لیے ویب انٹرفیس۔
  • GIMP، Figma، Blender اور Photoshop کے ساتھ مستحکم بازی کو مربوط کرنے کے لیے پلگ انز۔

مزید برآں، ہم RawNeRF (RAW Neural Radiance Fields) مشین لرننگ سسٹم کے کوڈ کی گوگل کی اشاعت کو نوٹ کر سکتے ہیں، جو کئی RAW امیجز کے ڈیٹا کی بنیاد پر، اندھیرے میں لی گئی انتہائی شور والی تصاویر کے معیار کو بہتر بنانے کی اجازت دیتا ہے۔ غریب روشنی. شور کو ختم کرنے کے علاوہ، پراجیکٹ کے تیار کردہ ٹولز تفصیل میں اضافہ، چکاچوند کو ختم کرنے، ایچ ڈی آر کی ترکیب اور تصویروں میں مجموعی روشنی کو تبدیل کرنے کے ساتھ ساتھ مختلف زاویوں سے کئی تصویروں کا استعمال کرتے ہوئے اشیاء کی سہ جہتی پوزیشن کو دوبارہ بنانا، نقطہ نظر کو تبدیل کریں، توجہ مرکوز کریں اور متحرک تصاویر بنائیں۔

تصویری ترکیب اور رات کی تصاویر میں شور کو کم کرنے کے لیے مشین لرننگ سسٹم
تصویری ترکیب اور رات کی تصاویر میں شور کو کم کرنے کے لیے مشین لرننگ سسٹم


ماخذ: opennet.ru

نیا تبصرہ شامل کریں