A rede neural Nvidia transforma esboços simples em belas paisagens

A rede neural Nvidia transforma esboços simples em belas paisagens
A cachoeira do fumante e a cachoeira de uma pessoa saudável

Todos nós sabemos como desenhar uma coruja. Primeiro você precisa desenhar um oval, depois outro círculo e então - você obtém uma linda coruja. Claro, isso é uma piada e muito antiga, mas os engenheiros da Nvidia tentaram tornar a fantasia realidade.

Novo desenvolvimento, que se chama GauGAN, cria paisagens deslumbrantes a partir de esboços muito simples (realmente simples - círculos, linhas e tudo). Claro, esse desenvolvimento é baseado em tecnologias modernas - ou seja, redes neurais adversárias generativas.

GauGAN permite criar mundos virtuais coloridos - e não apenas para diversão, mas também para o trabalho. Portanto, arquitetos, paisagistas, desenvolvedores de jogos - todos podem aprender algo útil. A inteligência artificial imediatamente “entende” o que uma pessoa deseja e complementa a ideia original com uma grande quantidade de detalhes.

“O brainstorming em termos de desenvolvimento de design é muito mais fácil com a ajuda do GauGAN, pois um pincel inteligente pode complementar o esboço inicial adicionando imagens de qualidade”, disse um desenvolvedor do GauGAN.

Os usuários desta ferramenta podem alterar a ideia original, modificar a paisagem ou outra imagem, adicionar céu, areia, mar, etc. Tudo o que seu coração deseja, e a adição leva apenas alguns segundos.

A rede neural foi treinada usando um banco de dados de milhões de imagens. Graças a isso, o sistema pode entender o que uma pessoa deseja e como conseguir o que deseja. Além disso, a rede neural não esquece os mínimos detalhes. Portanto, se você desenhar esquematicamente um lago e algumas árvores próximas a ele, depois que a paisagem for revivida, todos os objetos próximos serão refletidos no espelho da água do lago.

Você pode dizer ao sistema qual deve ser a superfície visível - ela pode ser coberta com grama, neve, água ou areia. Tudo isso pode ser transformado em um segundo, de modo que a neve se torne areia e, em vez de um deserto nevado, o artista obtenha uma paisagem desértica.

“É como um livro de colorir que diz onde colocar a árvore, onde está o sol e onde está o céu. Então, após a tarefa inicial, a rede neural anima a imagem, adiciona os detalhes e texturas necessários, desenha reflexos. Tudo isso baseado em imagens reais”, diz um dos desenvolvedores.


Embora o sistema careça de "compreensão" do mundo real, o sistema cria paisagens impressionantes. Isso ocorre porque duas redes neurais são usadas aqui, um gerador e um discriminador. O gerador cria uma imagem e a mostra ao discriminador. Ele, com base em milhões de imagens já vistas, escolhe as opções mais realistas.

É por isso que o gerador "sabe" onde devem estar as reflexões. Vale ressaltar que a ferramenta é muito flexível e equipada com um grande número de configurações. Assim, com ele, você pode pintar, ajustando-se ao estilo de um determinado artista, ou apenas brincar com a adição rápida de nascer ou pôr do sol.

Os desenvolvedores afirmam que o sistema não apenas pega imagens de algum lugar, adiciona-as e obtém o resultado. Não, todas as "imagens" recebidas são geradas. Ou seja, a rede neural “cria” como um verdadeiro artista (ou melhor ainda).

Até o momento, o programa não está disponível gratuitamente, mas em breve será possível testá-lo no trabalho. Isso pode ser feito na GPU Technology Conference 2019, que está em andamento na Califórnia. Os sortudos que puderam visitar a exposição já podem testar o GauGAN.

Há muito tempo as redes neurais são ensinadas a participar do processo criativo. Por exemplo, no ano passado, alguns deles poderia criar modelos 3D. Além disso, os desenvolvedores do DeepMind treinaram a rede neural para restaurar espaços e objetos tridimensionais a partir de desenhos, fotografias e esboços. Para recriar uma figura simples, uma imagem é suficiente para a rede neural, para criar objetos mais complexos, são necessárias cinco imagens para “treinamento”.

Quanto ao GauGAN, esta ferramenta certamente encontrará uma aplicação comercial digna - muitas áreas de negócios e ciências precisam desses serviços.

Fonte: habr.com

Adicionar um comentário