Das neuronale Netzwerk von Nvidia verwandelt einfache Skizzen in wunderschöne Landschaften

Das neuronale Netzwerk von Nvidia verwandelt einfache Skizzen in wunderschöne Landschaften
Der Wasserfall des Rauchers und der Wasserfall eines gesunden Menschen

Wir alle wissen, wie man eine Eule zeichnet. Zuerst müssen Sie ein Oval zeichnen, dann einen weiteren Kreis und dann erhalten Sie eine wunderschöne Eule. Natürlich ist das ein Witz, und zwar ein sehr alter, aber die Nvidia-Ingenieure haben versucht, die Fantasie wahr werden zu lassen.

Neuentwicklung, das GauGAN heißt, erstellt wunderschöne Landschaften aus sehr einfachen Skizzen (ganz einfach – Kreise, Linien und alles). Natürlich basiert diese Entwicklung auf modernen Technologien – nämlich generativen kontradiktorischen neuronalen Netzen.

Mit GauGAN können Sie farbenfrohe virtuelle Welten erschaffen – und das nicht nur zum Spaß, sondern auch für die Arbeit. Also, Architekten, Landschaftsarchitekten, Spieleentwickler – sie alle können etwas Nützliches lernen. Künstliche Intelligenz „versteht“ sofort, was ein Mensch will und ergänzt die ursprüngliche Idee mit vielen Details.

„Das Brainstorming in Bezug auf die Designentwicklung ist mit Hilfe von GauGAN viel einfacher, da ein intelligenter Pinsel die ursprüngliche Skizze durch das Hinzufügen hochwertiger Bilder ergänzen kann“, sagte ein GauGAN-Entwickler.

Benutzer dieses Tools können die ursprüngliche Idee ändern, die Landschaft oder ein anderes Bild ändern, Himmel, Sand, Meer usw. hinzufügen. Alles, was das Herz begehrt, und die Zugabe dauert nur wenige Sekunden.

Das neuronale Netzwerk wurde mithilfe einer Datenbank mit Millionen von Bildern trainiert. Dadurch kann das System verstehen, was eine Person will und wie sie erreichen kann, was sie will. Darüber hinaus vergisst das neuronale Netzwerk nicht die kleinsten Details. Wenn Sie also schematisch einen Teich und einige Bäume daneben zeichnen, spiegeln sich nach der Wiederbelebung der Landschaft alle Objekte in der Nähe im Spiegel des Teichwassers.

Sie können dem System vorgeben, wie die sichtbare Oberfläche aussehen soll – sie kann mit Gras, Schnee, Wasser oder Sand bedeckt sein. All dies kann in einer Sekunde verwandelt werden, sodass der Schnee zu Sand wird und der Künstler statt einer verschneiten Einöde eine Wüstenlandschaft erhält.

„Es ist wie ein Malbuch, das sagt, wo der Baum platziert werden soll, wo die Sonne ist und wo der Himmel ist. Dann, nach der ersten Aufgabe, animiert das neuronale Netzwerk das Bild, fügt die notwendigen Details und Texturen hinzu und zeichnet Reflexionen. All dies basiert auf echten Bildern“, sagt einer der Entwickler.


Obwohl es dem System an „Verständnis“ für die reale Welt mangelt, schafft das System spektakuläre Landschaften. Dies liegt daran, dass hier zwei neuronale Netze verwendet werden, ein Generator und ein Diskriminator. Der Generator erstellt ein Bild und zeigt es dem Diskriminator. Basierend auf Millionen zuvor gesehener Bilder wählt er die realistischsten Optionen aus.

Deshalb „weiß“ der Generator, wo die Reflexionen sein sollen. Bemerkenswert ist, dass das Tool sehr flexibel ist und über eine Vielzahl von Einstellungen verfügt. So können Sie damit malen und sich an den Stil eines bestimmten Künstlers anpassen oder einfach mit dem schnellen Hinzufügen von Sonnenauf- oder -untergang herumspielen.

Die Entwickler behaupten, dass das System nicht einfach Bilder von irgendwoher nimmt, sie zusammenfügt und das Ergebnis erhält. Nein, alle empfangenen „Bilder“ werden generiert. Das heißt, das neuronale Netzwerk „kreiert“ wie ein echter Künstler (oder noch besser).

Bisher ist das Programm nicht frei verfügbar, aber bald wird es möglich sein, es in der Arbeit zu testen. Dies kann auf der GPU Technology Conference 2019 erfolgen, die derzeit in Kalifornien stattfindet. Die Glücklichen, die die Ausstellung besuchen konnten, können GauGAN bereits testen.

Neuronalen Netzen wird seit langem beigebracht, am kreativen Prozess teilzunehmen. Zum Beispiel letztes Jahr einige davon könnte 3D-Modelle erstellen. Darüber hinaus trainierten die Entwickler von DeepMind das neuronale Netzwerk, um dreidimensionale Räume und Objekte aus Zeichnungen, Fotos und Skizzen wiederherzustellen. Um eine einfache Figur nachzubilden, reicht dem neuronalen Netzwerk ein Bild, um komplexere Objekte zu erstellen, sind fünf Bilder zum „Training“ erforderlich.

Was GauGAN betrifft, so wird dieses Tool eindeutig eine würdige kommerzielle Anwendung finden – viele Bereiche der Wirtschaft und Wissenschaft haben einen Bedarf an solchen Diensten.

Source: habr.com

Kommentar hinzufügen