شبکه عصبی Nvidia طرح های ساده را به مناظر زیبا تبدیل می کند

شبکه عصبی Nvidia طرح های ساده را به مناظر زیبا تبدیل می کند
آبشار آدم سیگاری و آبشار آدم سالم

همه ما می دانیم که چگونه یک جغد بکشیم. ابتدا باید یک بیضی بکشید، سپس یک دایره دیگر، و سپس - یک جغد زرق و برق دار می گیرید. البته این یک شوخی و یک شوخی بسیار قدیمی است، اما مهندسان انویدیا سعی کردند این فانتزی را به واقعیت تبدیل کنند.

توسعه جدیدکه GauGAN نام دارد، از طرح های بسیار ساده (واقعا ساده - دایره ها، خطوط و همه) مناظر باشکوهی ایجاد می کند. البته، این توسعه مبتنی بر فناوری های مدرن - یعنی شبکه های عصبی متخاصم مولد است.

GauGAN به شما اجازه می دهد تا جهان های مجازی رنگارنگ ایجاد کنید - و نه تنها برای سرگرمی، بلکه برای کار. بنابراین، معماران، طراحان منظره، توسعه دهندگان بازی - همه آنها می توانند چیز مفیدی یاد بگیرند. هوش مصنوعی بلافاصله آنچه را که یک فرد می خواهد "درک" می کند و ایده اصلی را با جزئیات زیادی تکمیل می کند.

یکی از توسعه دهندگان GauGAN گفت: «طوفان فکری از نظر توسعه طراحی با کمک GauGAN بسیار ساده تر است، زیرا یک قلم موی هوشمند می تواند طرح اولیه را با افزودن تصاویر با کیفیت تکمیل کند.

کاربران این ابزار می توانند ایده اصلی را تغییر دهند، منظره یا تصویر دیگر را تغییر دهند، آسمان، شن، دریا و غیره را اضافه کنند. هر چیزی که دل شما می خواهد، و اضافه کردن فقط چند ثانیه طول می کشد.

شبکه عصبی با استفاده از پایگاه داده ای از میلیون ها تصویر آموزش داده شد. به لطف این، سیستم می تواند بفهمد که یک فرد چه می خواهد و چگونه به آنچه می خواهد دست یابد. علاوه بر این، شبکه عصبی کوچکترین جزئیات را فراموش نمی کند. بنابراین، اگر به صورت شماتیک یک حوض و چند درخت در کنار آن ترسیم کنید، پس از احیای منظره، تمام اشیاء نزدیک در آینه آب حوض منعکس می شوند.

شما می توانید به سیستم بگویید که سطح قابل مشاهده باید چه باشد - می توان آن را با چمن، برف، آب یا ماسه پوشاند. همه اینها را می توان در یک ثانیه دگرگون کرد تا برف تبدیل به شن شود و به جای یک زمین بایر برفی، هنرمند منظره ای بیابانی پیدا کند.

این مانند یک کتاب رنگ آمیزی است که می گوید درخت را کجا قرار دهیم، خورشید کجا و آسمان کجا. سپس، پس از کار اولیه، شبکه عصبی تصویر را متحرک می کند، جزئیات و بافت های لازم را اضافه می کند، بازتاب ها را ترسیم می کند. همه اینها بر اساس تصاویر واقعی است.» یکی از توسعه دهندگان می گوید.


اگرچه این سیستم فاقد "درک" از دنیای واقعی است، اما این سیستم مناظر دیدنی ایجاد می کند. این به این دلیل است که در اینجا از دو شبکه عصبی، یک مولد و یک تشخیص دهنده استفاده می شود. مولد یک تصویر ایجاد می کند و آن را به متمایز کننده نشان می دهد. او بر اساس میلیون ها تصویری که قبلا دیده شده بود، واقعی ترین گزینه ها را انتخاب می کند.

به همین دلیل است که مولد "می داند" بازتاب ها کجا باید باشند. شایان ذکر است که ابزار بسیار منعطف و مجهز به تعداد زیادی تنظیمات است. بنابراین، با آن، می توانید نقاشی کنید، با سبک یک هنرمند خاص تطبیق دهید، یا فقط با اضافه شدن سریع طلوع یا غروب خورشید در اطراف بازی کنید.

توسعه دهندگان ادعا می کنند که این سیستم فقط تصاویر را از جایی نمی گیرد، آنها را با هم جمع می کند و به نتیجه می رسد. خیر، همه "تصاویر" دریافتی تولید می شوند. به این معنا که شبکه عصبی مانند یک هنرمند واقعی (یا حتی بهتر) "آفرینش" می کند.

تاکنون این برنامه به صورت رایگان در دسترس نیست، اما به زودی امکان تست آن در کار وجود خواهد داشت. این را می توان در کنفرانس فناوری GPU 2019، که در حال حاضر در کالیفرنیا در حال برگزاری است، انجام داد. افراد خوش شانسی که توانستند از نمایشگاه بازدید کنند می توانند GauGAN را آزمایش کنند.

شبکه‌های عصبی مدت‌هاست که آموزش داده شده است تا در فرآیند خلاقیت شرکت کنند. به عنوان مثال، در سال گذشته، برخی از آنها می تواند مدل های سه بعدی ایجاد کند. علاوه بر این، توسعه دهندگان DeepMind شبکه عصبی را برای بازیابی فضاها و اشیاء سه بعدی از نقاشی ها، عکس ها و طرح ها آموزش دادند. برای بازسازی یک شکل ساده، یک تصویر برای شبکه عصبی کافی است، برای ایجاد اشیاء پیچیده تر، پنج تصویر برای "آموزش" مورد نیاز است.

همانطور که برای GauGAN، این ابزار به وضوح یک کاربرد تجاری ارزشمند پیدا می کند - بسیاری از زمینه های تجارت و علم به چنین خدماتی نیاز دارند.

منبع: www.habr.com

اضافه کردن نظر