Водопад курильщика и водопад здорового человека
Все мы знаем, как нарисовать сову. Нужно сначала нарисовать овал, потом еще окружность, ну а потом — получается шикарная сова. Конечно, это шутка, причем очень старая, но инженеры Nvidia постарались сделать так, чтобы фантазия стала реальностью.
GauGAN позволяет создавать красочные виртуальные миры — и не только для развлечения, но и для работы. Так, архитекторы, специалисты по ландшафтному дизайну, разработчики игр — все они могут почерпнуть что-то полезное. Искусственный интеллект сходу «понимает», чего хочет человек и дополняет изначальную идею огромным количеством деталей.
«Мозговой штурм в плане разработки дизайна дается гораздо легче с использованием помощи GauGAN, поскольку умная кисть может дополнить изначальный набросок, добавив качественные изображения», — заявил один из разработчиков GauGAN.
Пользователи этого инструмента могут изменять изначальную задумку, модифицировать пейзаж или другое изображение, добавлять небо, пески, море и т.п. Все, что душе угодно, причем добавление происходит всего за пару секунд.
Нейросеть тренировали с использованием базы в миллионы изображений. Благодаря этому система может понять, чего хочет человек и как добиться желаемого. Причем нейросеть не забывает о мельчайших деталях. Так, если нарисовать схематично пруд и какие-то деревья рядом с ним, то после оживления пейзажа все близлежащие объекты будут отражаться в зеркале воды пруда.
Системе можно указывать, какой должна быть видимая поверхность — она может быть покрыта травой, снегом, водой или песком. Все это можно за секунду преобразовать, так что снег станет песком и вместо заснеженной пустоши художник получит пустынный ландшафт.
«Это как книжка раскраска, в которой говорится, где размещать дерево, где — солнце, а где — небо. Затем, после изначальной задачи нейронная сеть оживляет картину, добавляет необходимые детали и текстуры, прорисовывает отражения. Все это основывается на реальных изображениях», — говорит один из разработчиков.
Несмотря на то, что системе не хватает «понимания» реального мира, система создает впечатляющие пейзажи. Все потому, что здесь используются две нейросети, генератор и дискриминатор. Генератор создает изображение и показывает его дискриминатору. Тот, основываясь на миллионах виденных ранее изображений, выбирает наиболее реалистичные варианты.
Именно поэтому генератор «знает», где должны быть отражения. Стоит отметить, что инструмент весьма гибкий и оснащен большим количеством настроек. Так, с его помощью можно писать картины, подстраиваясь под стиль определенного художника или просто баловаться с быстрым добавлением восхода или заката.
Разработчики утверждают, что система не просто берет откуда-то изображения, складывает вместе и получает результат. Нет, все получаемые «картинки» являются генерированными. То есть нейросеть «творит», как настоящий художник (или даже лучше).
Пока что программы нет в свободном доступе, но вскоре ее можно будет опробовать в работе. Это можно сделать на технологической выставке GPU Technology Conference 2019, которая прямо сейчас идет в Калифорнии. Счастливчики, которые смогли посетит выставку, уже могут потестировать GauGAN.
Нейросети уже давно учат принимать участие в творческом процессе. Например, в прошлом году, некоторые из них
Что касается GauGAN, то этот инструмент явно найдет достойное коммерческое применение — у многих направлений бизнеса и науки есть необходимость в подобных сервисах.
Источник: habr.com