La rete neurale Nvidia trasforma semplici schizzi in splendidi paesaggi

La rete neurale Nvidia trasforma semplici schizzi in splendidi paesaggi
La cascata del fumatore e la cascata di una persona sana

Sappiamo tutti come disegnare un gufo. Per prima cosa devi disegnare un ovale, poi un altro cerchio e poi - ottieni uno splendido gufo. Certo, questo è uno scherzo, e molto vecchio, ma gli ingegneri di Nvidia hanno cercato di realizzare la fantasia.

Nuovo sviluppo, che si chiama GauGAN, crea splendidi paesaggi da schizzi molto semplici (davvero semplici: cerchi, linee e tutto il resto). Naturalmente, questo sviluppo si basa su tecnologie moderne, vale a dire reti neurali avversarie generative.

GauGAN ti consente di creare mondi virtuali colorati e non solo per divertimento, ma anche per lavoro. Quindi, architetti, paesaggisti, sviluppatori di giochi: tutti possono imparare qualcosa di utile. L'intelligenza artificiale "capisce" immediatamente ciò che una persona vuole e integra l'idea originale con un'enorme quantità di dettagli.

"Il brainstorming in termini di sviluppo del design è molto più semplice con l'aiuto di GauGAN, poiché un pennello intelligente può integrare lo schizzo iniziale aggiungendo immagini di qualità", ha affermato uno sviluppatore di GauGAN.

Gli utenti di questo strumento possono cambiare l'idea originale, modificare il paesaggio o altra immagine, aggiungere cielo, sabbia, mare, ecc. Tutto ciò che il tuo cuore desidera e l'aggiunta richiede solo un paio di secondi.

La rete neurale è stata addestrata utilizzando un database di milioni di immagini. Grazie a ciò, il sistema può capire cosa vuole una persona e come ottenere ciò che vuole. Inoltre, la rete neurale non dimentica i minimi dettagli. Quindi, se disegni schematicamente uno stagno e alcuni alberi accanto ad esso, dopo che il paesaggio è stato rianimato, tutti gli oggetti vicini si rifletteranno nello specchio dell'acqua dello stagno.

Puoi dire al sistema quale dovrebbe essere la superficie visibile: può essere coperta da erba, neve, acqua o sabbia. Tutto questo può essere trasformato in un secondo, in modo che la neve diventi sabbia e invece di un deserto innevato, l'artista ottiene un paesaggio desertico.

“È come un libro da colorare che dice dove posizionare l'albero, dov'è il sole e dov'è il cielo. Quindi, dopo l'attività iniziale, la rete neurale anima l'immagine, aggiunge i dettagli e le trame necessari, disegna i riflessi. Tutto questo si basa su immagini reali", afferma uno degli sviluppatori.


Sebbene il sistema manchi di "comprensione" del mondo reale, il sistema crea paesaggi impressionanti. Questo perché qui vengono utilizzate due reti neurali, un generatore e un discriminatore. Il generatore crea un'immagine e la mostra al discriminatore. Lui, sulla base di milioni di immagini viste in precedenza, sceglie le opzioni più realistiche.

Ecco perché il generatore "sa" dove dovrebbero essere i riflessi. Vale la pena notare che lo strumento è molto flessibile e dotato di un gran numero di impostazioni. Quindi, con esso, puoi dipingere, adattandoti allo stile di un particolare artista, o semplicemente giocare con la rapida aggiunta dell'alba o del tramonto.

Gli sviluppatori affermano che il sistema non prende solo le immagini da qualche parte, le somma e ottiene il risultato. No, tutte le "immagini" ricevute vengono generate. Cioè, la rete neurale "crea" come un vero artista (o anche meglio).

Finora il programma non è disponibile gratuitamente, ma presto sarà possibile testarlo in funzione. Questo può essere fatto alla GPU Technology Conference 2019, attualmente in corso in California. I fortunati che hanno potuto visitare la mostra possono già testare GauGAN.

Le reti neurali sono state a lungo insegnate a prendere parte al processo creativo. Ad esempio, l'anno scorso, alcuni di loro potrebbe creare modelli 3D. Inoltre, gli sviluppatori di DeepMind hanno addestrato la rete neurale a ripristinare spazi e oggetti tridimensionali da disegni, fotografie e schizzi. Per ricreare una figura semplice è sufficiente un'immagine per la rete neurale, per creare oggetti più complessi sono necessarie cinque immagini per il "training".

Per quanto riguarda GauGAN, questo strumento troverà chiaramente una degna applicazione commerciale: molte aree del mondo degli affari e della scienza hanno bisogno di tali servizi.

Fonte: habr.com

Aggiungi un commento