La red neuronal de Nvidia convierte bocetos simples en hermosos paisajes

La red neuronal de Nvidia convierte bocetos simples en hermosos paisajes
La cascada del fumador y la cascada de una persona sana

Todos sabemos cómo dibujar un búho. Primero debes dibujar un óvalo, luego otro círculo y luego, resulta un hermoso búho. Por supuesto, esto es una broma, y ​​muy antigua, pero los ingenieros de Nvidia intentaron hacer realidad la fantasía.

Nuevo desarrollo, que se llama GauGAN, crea hermosos paisajes a partir de bocetos muy simples (realmente simples: círculos, líneas y todo). Por supuesto, este desarrollo se basa en tecnologías modernas, es decir, redes neuronales antagónicas generativas.

GauGAN le permite crear mundos virtuales coloridos, y no solo por diversión, sino también por trabajo. Entonces, arquitectos, paisajistas, desarrolladores de juegos, todos pueden aprender algo útil. La inteligencia artificial "entiende" de inmediato lo que una persona quiere y complementa la idea original con una gran cantidad de detalles.

“La lluvia de ideas en términos de desarrollo de diseño es mucho más fácil con la ayuda de GauGAN, ya que un pincel inteligente puede complementar el boceto inicial agregando imágenes de calidad”, dijo un desarrollador de GauGAN.

Los usuarios de esta herramienta pueden cambiar la idea original, modificar el paisaje u otra imagen, agregar cielo, arena, mar, etc. Todo lo que tu corazón desea, y la adición toma solo un par de segundos.

La red neuronal se entrenó utilizando una base de datos de millones de imágenes. Gracias a esto, el sistema puede entender qué quiere una persona y cómo conseguirlo. Además, la red neuronal no se olvida de los detalles más pequeños. Entonces, si dibuja esquemáticamente un estanque y algunos árboles al lado, luego de que se reviva el paisaje, todos los objetos cercanos se reflejarán en el espejo del agua del estanque.

Puede decirle al sistema cuál debe ser la superficie visible: puede estar cubierta de hierba, nieve, agua o arena. Todo esto se puede transformar en un segundo, de modo que la nieve se convierte en arena y en lugar de un páramo nevado, el artista consigue un paisaje desértico.

“Es como un libro para colorear que dice dónde colocar el árbol, dónde está el sol y dónde está el cielo. Luego, después de la tarea inicial, la red neuronal anima la imagen, agrega los detalles y texturas necesarios, dibuja reflejos. Todo esto está basado en imágenes reales”, dice uno de los desarrolladores.


Aunque el sistema carece de "comprensión" del mundo real, el sistema crea paisajes espectaculares. Esto se debe a que aquí se utilizan dos redes neuronales, un generador y un discriminador. El generador crea una imagen y se la muestra al discriminador. Él, basándose en millones de imágenes vistas anteriormente, elige las opciones más realistas.

Es por eso que el generador "sabe" dónde deben estar los reflejos. Vale la pena señalar que la herramienta es muy flexible y está equipada con una gran cantidad de configuraciones. Entonces, con él, puede pintar, ajustarse al estilo de un artista en particular, o simplemente jugar con la adición rápida de amanecer o atardecer.

Los desarrolladores afirman que el sistema no solo toma imágenes de algún lugar, las agrega y obtiene el resultado. No, se generan todas las "imágenes" recibidas. Es decir, la red neuronal “crea” como un verdadero artista (o incluso mejor).

Hasta el momento, el programa no está disponible gratuitamente, pero pronto será posible probarlo en el trabajo. Esto se puede hacer en la GPU Technology Conference 2019, que actualmente se está llevando a cabo en California. Los afortunados que pudieron visitar la exposición ya pueden probar GauGAN.

Durante mucho tiempo se ha enseñado a las redes neuronales a participar en el proceso creativo. Por ejemplo, el año pasado, algunos de ellos podría crear modelos 3D. Además, los desarrolladores de DeepMind entrenaron la red neuronal para restaurar espacios y objetos tridimensionales a partir de dibujos, fotografías y bocetos. Para recrear una figura simple, la red neuronal necesita una imagen; para crear objetos más complejos, se requieren cinco imágenes para el "entrenamiento".

En cuanto a GauGAN, esta herramienta encontrará claramente una aplicación comercial digna: muchas áreas de los negocios y la ciencia necesitan tales servicios.

Fuente: habr.com

Añadir un comentario