تقوم شبكة Nvidia العصبية بتحويل الرسومات البسيطة إلى مناظر طبيعية جميلة

تقوم شبكة Nvidia العصبية بتحويل الرسومات البسيطة إلى مناظر طبيعية جميلة
شلال المدخن وشلال الشخص السليم

نعلم جميعًا كيفية رسم بومة. تحتاج أولاً إلى رسم شكل بيضاوي ، ثم دائرة أخرى ، وبعد ذلك - تحصل على بومة رائعة. بالطبع ، هذه مزحة ، وهي مزحة قديمة جدًا ، لكن مهندسي Nvidia حاولوا تحويل الخيال إلى حقيقة.

تطور جديد، والتي تسمى GauGAN ، تنشئ مناظر طبيعية رائعة من رسومات بسيطة للغاية (بسيطة حقًا - دوائر وخطوط وكلها). بالطبع ، يعتمد هذا التطور على التقنيات الحديثة - أي الشبكات العصبية التوليدية.

يتيح لك GauGAN إنشاء عوالم افتراضية ملونة - ليس فقط من أجل المتعة ، ولكن أيضًا للعمل. لذا ، المهندسين المعماريين ومصممي المناظر الطبيعية ومطوري الألعاب - يمكنهم جميعًا تعلم شيء مفيد. الذكاء الاصطناعي "يفهم" على الفور ما يريده الشخص ويكمل الفكرة الأصلية بقدر كبير من التفاصيل.

قال أحد مطوري GauGAN: "إن العصف الذهني فيما يتعلق بتطوير التصميم أسهل كثيرًا بمساعدة GauGAN ، نظرًا لأن الفرشاة الذكية يمكن أن تكمل الرسم الأولي بإضافة صور عالية الجودة".

يمكن لمستخدمي هذه الأداة تغيير الفكرة الأصلية أو تعديل المناظر الطبيعية أو أي صورة أخرى أو إضافة السماء والرمل والبحر وما إلى ذلك. كل ما تتمناه قلبك ، وتستغرق الإضافة بضع ثوانٍ فقط.

تم تدريب الشبكة العصبية باستخدام قاعدة بيانات من ملايين الصور. بفضل هذا ، يمكن للنظام فهم ما يريده الشخص وكيفية تحقيق ما يريده. علاوة على ذلك ، لا تنسى الشبكة العصبية أصغر التفاصيل. لذلك ، إذا رسمت بشكل تخطيطي بركة وبعض الأشجار بجانبها ، فبعد إحياء المشهد الطبيعي ، ستنعكس جميع الكائنات المجاورة في مرآة مياه البركة.

يمكنك إخبار النظام بما يجب أن يكون عليه السطح المرئي - يمكن تغطيته بالعشب أو الثلج أو الماء أو الرمل. كل هذا يمكن أن يتحول في ثانية ، بحيث يتحول الثلج إلى رمال ، وبدلاً من أرض قاحلة ثلجية ، يحصل الفنان على منظر طبيعي صحراوي.

"إنه يشبه كتاب التلوين الذي يقول أين نضع الشجرة ، وأين الشمس ، وأين السماء. بعد ذلك ، بعد المهمة الأولية ، تقوم الشبكة العصبية بتحريك الصورة ، وتضيف التفاصيل والأنسجة اللازمة ، وترسم الانعكاسات. كل هذا يعتمد على صور حقيقية "، كما يقول أحد المطورين.


على الرغم من أن النظام يفتقر إلى "فهم" العالم الحقيقي ، إلا أن النظام يخلق مناظر طبيعية خلابة. هذا بسبب استخدام شبكتين عصبيتين هنا ، مولد ومميز. ينشئ المولد صورة ويظهرها للمميز. إنه ، استنادًا إلى ملايين الصور التي تمت مشاهدتها سابقًا ، يختار الخيارات الأكثر واقعية.

هذا هو السبب في أن المولد "يعرف" أين يجب أن تكون الانعكاسات. تجدر الإشارة إلى أن الأداة مرنة للغاية ومجهزة بعدد كبير من الإعدادات. لذلك ، باستخدامه ، يمكنك الرسم ، والتكيف مع أسلوب فنان معين ، أو مجرد اللعب مع الإضافة السريعة لشروق الشمس أو غروبها.

يدعي المطورون أن النظام لا يلتقط الصور فقط من مكان ما ، ويجمعها معًا ويحصل على النتيجة. لا ، يتم إنشاء جميع "الصور" المستلمة. أي أن الشبكة العصبية "تخلق" مثل فنان حقيقي (أو حتى أفضل).

حتى الآن ، لا يتوفر البرنامج مجانًا ، ولكن قريبًا سيكون من الممكن اختباره في العمل. يمكن القيام بذلك في مؤتمر GPU Technology 2019 ، والذي يعقد حاليًا في كاليفورنيا. المحظوظون الذين تمكنوا من زيارة المعرض يمكنهم بالفعل اختبار GauGAN.

لطالما تم تعليم الشبكات العصبية للمشاركة في العملية الإبداعية. على سبيل المثال ، في العام الماضي ، بعض منهم يمكن أن تخلق نماذج ثلاثية الأبعاد. بالإضافة إلى ذلك ، قام المطورون من DeepMind بتدريب الشبكة العصبية لاستعادة المساحات والأشياء ثلاثية الأبعاد من الرسومات والصور والرسومات. من أجل إعادة تكوين شكل بسيط ، تكفي صورة واحدة للشبكة العصبية ، لإنشاء كائنات أكثر تعقيدًا ، يلزم وجود خمس صور "للتدريب".

بالنسبة إلى GauGAN ، ستجد هذه الأداة بوضوح تطبيقًا تجاريًا مفيدًا - تحتاج العديد من مجالات الأعمال والعلوم إلى مثل هذه الخدمات.

المصدر: www.habr.com

إضافة تعليق