NVIDIA مشین لرننگ سسٹم کے لیے کوڈ کھولتا ہے جو خاکوں سے مناظر کی ترکیب کرتا ہے۔

Компания NVIDIA опубликовала исходные тексты системы машинного обучения SPADE (GauGAN), позволяющей синтезировать реалистичные пейзажи на основе грубых набросков, а также связанные с проектом нетренированные модели. Система была продемонстрирована в марте на конференции GTC 2019, но код был опубликован только вчера. Наработки открыты под свободной лицензией CC BY-NC-SA 4.0 (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), допускающей использование только в некоммерческих целях. Код написан на языке Python с применением фреймворка PyTorch.

NVIDIA مشین لرننگ سسٹم کے لیے کوڈ کھولتا ہے جو خاکوں سے مناظر کی ترکیب کرتا ہے۔

Наброски оформляются в виде сегментированной карты, определяющей размещение примерных объектов на сцене. Характер генерируемых объектов задаётся при помощи цветовых меток. Например, голубая заливка преобразуется в небо, синяя в воду, тёмно зелёная в деревья, светло зелёная в траву, светло коричневая в камни, тёмно коричневая в горы, серая в снег, коричневая линия преобразуется в дорогу, а синяя линия в реку. Дополнительно на основе выбора эталонных изображений определяется общий стиль композиции и время суток. Предлагаемый инструмент для создания виртуальных миров может оказаться полезным широкому кругу специалистов, от архитекторов и планировщиков городской среды до разработчиков игр и ландшафтных дизайнеров.

NVIDIA مشین لرننگ سسٹم کے لیے کوڈ کھولتا ہے جو خاکوں سے مناظر کی ترکیب کرتا ہے۔

Объекты синтезируются генеративно-состязательной нейронной сетью (GAN), которая на основе схематичной сегментированной карты создаёт реалистичные изображения, заимствуя детали из модели, предварительно обученной на нескольких миллионах фотоснимков. В отличие от ранее развиваемых систем синтеза изображений предложенный метод основан на применении адаптивного пространственного преобразования с последующей трансформацией на основе машинного обучения. Обработка сегментированной карты вместо семантической разметки позволяет добиться точного соответствия результата и контролировать стиль.

NVIDIA مشین لرننگ سسٹم کے لیے کوڈ کھولتا ہے جو خاکوں سے مناظر کی ترکیب کرتا ہے۔

حقیقت پسندی کو حاصل کرنے کے لیے، دو عصبی نیٹ ورکس ایک دوسرے سے مقابلہ کرتے ہیں: ایک جنریٹر اور ایک امتیاز کرنے والا۔ جنریٹر حقیقی تصویروں کے مرکب عناصر کی بنیاد پر تصاویر تیار کرتا ہے، اور امتیاز کرنے والا حقیقی تصویروں سے ممکنہ انحراف کی نشاندہی کرتا ہے۔ نتیجے کے طور پر، فیڈ بیک بنتا ہے، جس کی بنیاد پر جنریٹر تیزی سے بہتر نمونے مرتب کرنا شروع کر دیتا ہے جب تک کہ امتیاز کرنے والا ان کو حقیقی نمونوں سے ممتاز کرنا بند نہ کر دے۔



ماخذ: opennet.ru

نیا تبصرہ شامل کریں