NVIDIA는 스케치에서 풍경을 합성하는 기계 학습 시스템용 코드를 공개합니다.

Компания NVIDIA опубликовала исходные тексты системы машинного обучения SPADE (GauGAN), позволяющей синтезировать реалистичные пейзажи на основе грубых набросков, а также связанные с проектом нетренированные модели. Система была продемонстрирована в марте на конференции GTC 2019, но код был опубликован только вчера. Наработки открыты под свободной лицензией CC BY-NC-SA 4.0 (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), допускающей использование только в некоммерческих целях. Код написан на языке Python с применением фреймворка PyTorch.

NVIDIA는 스케치에서 풍경을 합성하는 기계 학습 시스템용 코드를 공개합니다.

Наброски оформляются в виде сегментированной карты, определяющей размещение примерных объектов на сцене. Характер генерируемых объектов задаётся при помощи цветовых меток. Например, голубая заливка преобразуется в небо, синяя в воду, тёмно зелёная в деревья, светло зелёная в траву, светло коричневая в камни, тёмно коричневая в горы, серая в снег, коричневая линия преобразуется в дорогу, а синяя линия в реку. Дополнительно на основе выбора эталонных изображений определяется общий стиль композиции и время суток. Предлагаемый инструмент для создания виртуальных миров может оказаться полезным широкому кругу специалистов, от архитекторов и планировщиков городской среды до разработчиков игр и ландшафтных дизайнеров.

NVIDIA는 스케치에서 풍경을 합성하는 기계 학습 시스템용 코드를 공개합니다.

Объекты синтезируются генеративно-состязательной нейронной сетью (GAN), которая на основе схематичной сегментированной карты создаёт реалистичные изображения, заимствуя детали из модели, предварительно обученной на нескольких миллионах фотоснимков. В отличие от ранее развиваемых систем синтеза изображений предложенный метод основан на применении адаптивного пространственного преобразования с последующей трансформацией на основе машинного обучения. Обработка сегментированной карты вместо семантической разметки позволяет добиться точного соответствия результата и контролировать стиль.

NVIDIA는 스케치에서 풍경을 합성하는 기계 학습 시스템용 코드를 공개합니다.

현실성을 달성하기 위해 생성자와 판별자라는 두 개의 신경망이 서로 경쟁합니다. 생성기는 실제 사진의 혼합 요소를 기반으로 이미지를 생성하고, 판별기는 실제 이미지와 편차가 있을 수 있는지 식별합니다. 결과적으로 피드백이 형성되며, 이를 기반으로 생성자는 판별자가 실제 샘플과 구별을 중단할 때까지 점점 더 나은 샘플을 구성하기 시작합니다.



출처 : opennet.ru

코멘트를 추가