Wehe ʻo NVIDIA i ke code no kahi ʻōnaehana aʻo mīkini e hoʻohui i nā ʻāina mai nā sketches

Компания NVIDIA опубликовала исходные тексты системы машинного обучения SPADE (GauGAN), позволяющей синтезировать реалистичные пейзажи на основе грубых набросков, а также связанные с проектом нетренированные модели. Система была продемонстрирована в марте на конференции GTC 2019, но код был опубликован только вчера. Наработки открыты под свободной лицензией CC BY-NC-SA 4.0 (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), допускающей использование только в некоммерческих целях. Код написан на языке Python с применением фреймворка PyTorch.

Wehe ʻo NVIDIA i ke code no kahi ʻōnaehana aʻo mīkini e hoʻohui i nā ʻāina mai nā sketches

Наброски оформляются в виде сегментированной карты, определяющей размещение примерных объектов на сцене. Характер генерируемых объектов задаётся при помощи цветовых меток. Например, голубая заливка преобразуется в небо, синяя в воду, тёмно зелёная в деревья, светло зелёная в траву, светло коричневая в камни, тёмно коричневая в горы, серая в снег, коричневая линия преобразуется в дорогу, а синяя линия в реку. Дополнительно на основе выбора эталонных изображений определяется общий стиль композиции и время суток. Предлагаемый инструмент для создания виртуальных миров может оказаться полезным широкому кругу специалистов, от архитекторов и планировщиков городской среды до разработчиков игр и ландшафтных дизайнеров.

Wehe ʻo NVIDIA i ke code no kahi ʻōnaehana aʻo mīkini e hoʻohui i nā ʻāina mai nā sketches

Объекты синтезируются генеративно-состязательной нейронной сетью (GAN), которая на основе схематичной сегментированной карты создаёт реалистичные изображения, заимствуя детали из модели, предварительно обученной на нескольких миллионах фотоснимков. В отличие от ранее развиваемых систем синтеза изображений предложенный метод основан на применении адаптивного пространственного преобразования с последующей трансформацией на основе машинного обучения. Обработка сегментированной карты вместо семантической разметки позволяет добиться точного соответствия результата и контролировать стиль.

Wehe ʻo NVIDIA i ke code no kahi ʻōnaehana aʻo mīkini e hoʻohui i nā ʻāina mai nā sketches

No ka hoʻokō ʻana i ka ʻoiaʻiʻo, ʻelua mau neural network e hoʻokūkū me kekahi i kekahi: kahi generator a me kahi mea hoʻokae. Hoʻokumu ka mīkini hana i nā kiʻi e pili ana i ka hui ʻana i nā mea o nā kiʻi maoli, a ʻo ka mea hoʻokae e ʻike i nā ʻokoʻa mai nā kiʻi maoli. ʻO ka hopena, ua hoʻokumu ʻia nā manaʻo, ma ke kumu e hoʻomaka ai ka mea hana e haku i nā mea hoʻohālike i ʻoi aku ka maikaʻi a hiki i ka pau ʻana o ka mea hoʻokae e hoʻokaʻawale iā lākou mai nā mea maoli.



Source: opennet.ru

Pākuʻi i ka manaʻo hoʻopuka