Το νευρωνικό δίκτυο Nvidia μετατρέπει τα απλά σκίτσα σε όμορφα τοπία

Το νευρωνικό δίκτυο Nvidia μετατρέπει τα απλά σκίτσα σε όμορφα τοπία
Καταρράκτης καπνιστή και καταρράκτης υγιούς ανθρώπου

Όλοι ξέρουμε πώς να σχεδιάζουμε μια κουκουβάγια. Πρώτα πρέπει να σχεδιάσετε ένα οβάλ, μετά έναν άλλο κύκλο και μετά θα έχετε μια υπέροχη κουκουβάγια. Φυσικά, αυτό είναι ένα αστείο, και πολύ παλιό, αλλά οι μηχανικοί της Nvidia προσπάθησαν να κάνουν τη φαντασίωση να γίνει πραγματικότητα.

Νέα εξέλιξη, που ονομάζεται GauGAN, δημιουργεί υπέροχα τοπία από πολύ απλά σκίτσα (πραγματικά απλά - κύκλοι, γραμμές και τα πάντα). Φυσικά, αυτή η ανάπτυξη βασίζεται σε σύγχρονες τεχνολογίες - συγκεκριμένα σε γενετικά αντίπαλα νευρωνικά δίκτυα.

Το GauGAN σάς επιτρέπει να δημιουργείτε πολύχρωμους εικονικούς κόσμους - όχι μόνο για ψυχαγωγία, αλλά και για εργασία. Έτσι, αρχιτέκτονες, σχεδιαστές τοπίου, προγραμματιστές παιχνιδιών - μπορούν όλοι να μάθουν κάτι χρήσιμο. Η τεχνητή νοημοσύνη «καταλαβαίνει» αμέσως τι θέλει ένα άτομο και συμπληρώνει την αρχική ιδέα με έναν τεράστιο αριθμό λεπτομερειών.

«Ο καταιγισμός ιδεών ενός σχεδίου είναι πολύ πιο εύκολος χρησιμοποιώντας το GauGAN, επειδή το έξυπνο πινέλο μπορεί να βελτιώσει το αρχικό σκίτσο με ποιοτικές εικόνες», είπε ένας από τους προγραμματιστές του GauGAN.

Οι χρήστες αυτού του εργαλείου μπορούν να αλλάξουν την αρχική ιδέα, να τροποποιήσουν ένα τοπίο ή άλλη εικόνα, να προσθέσουν ουρανό, άμμο, θάλασσα κ.λπ. Ό,τι επιθυμεί η καρδιά σας και η προσθήκη του διαρκεί μόνο μερικά δευτερόλεπτα.

Το νευρωνικό δίκτυο εκπαιδεύτηκε χρησιμοποιώντας μια βάση δεδομένων με εκατομμύρια εικόνες. Χάρη σε αυτό, το σύστημα μπορεί να καταλάβει τι θέλει ένα άτομο και πώς να πετύχει αυτό που θέλει. Επιπλέον, το νευρωνικό δίκτυο δεν ξεχνά και τις πιο μικρές λεπτομέρειες. Έτσι, αν σχεδιάσετε ένα σχηματικό διάγραμμα μιας λίμνης και μερικά δέντρα δίπλα της, τότε αφού το τοπίο ζωντανέψει, όλα τα κοντινά αντικείμενα θα αντανακλώνται στον καθρέφτη του νερού της λίμνης.

Το σύστημα μπορεί να πει ποια θα πρέπει να είναι η ορατή επιφάνεια - μπορεί να καλυφθεί με γρασίδι, χιόνι, νερό ή άμμο. Όλα αυτά μπορούν να μεταμορφωθούν σε ένα δευτερόλεπτο, ώστε το χιόνι να γίνει άμμος και αντί για μια χιονισμένη ερημιά, ο καλλιτέχνης να αποκτήσει ένα έρημο τοπίο.

«Είναι σαν ένα βιβλίο ζωγραφικής που σου λέει πού να τοποθετήσεις το δέντρο, πού είναι ο ήλιος και πού είναι ο ουρανός. Στη συνέχεια, μετά την αρχική εργασία, το νευρωνικό δίκτυο ζωντανεύει την εικόνα, προσθέτει τις απαραίτητες λεπτομέρειες και υφές και σχεδιάζει αντανακλάσεις. «Όλα αυτά βασίζονται σε πραγματικές εικόνες», λέει ένας από τους προγραμματιστές.


Αν και το σύστημα στερείται «κατανόησης» του πραγματικού κόσμου, το σύστημα παράγει εντυπωσιακά τοπία. Αυτό συμβαίνει επειδή εδώ χρησιμοποιούνται δύο νευρωνικά δίκτυα, ένας γεννήτρια και ένας διαχωριστής. Η γεννήτρια δημιουργεί μια εικόνα και την εμφανίζει στον διακρίνοντα. Αυτός, βασισμένος σε εκατομμύρια εικόνες που έχετε δει στο παρελθόν, επιλέγει τις πιο ρεαλιστικές επιλογές.

Αυτός είναι ο λόγος που η γεννήτρια «ξέρει» πού πρέπει να βρίσκονται οι αντανακλάσεις. Αξίζει να σημειωθεί ότι το εργαλείο είναι πολύ ευέλικτο και εξοπλισμένο με μεγάλο αριθμό ρυθμίσεων. Έτσι, με τη βοήθειά του, μπορείτε να ζωγραφίσετε εικόνες, προσαρμοσμένες στο στυλ ενός συγκεκριμένου καλλιτέχνη ή απλώς να ασχοληθείτε με την γρήγορη προσθήκη ανατολής ή δύσης.

Οι προγραμματιστές ισχυρίζονται ότι το σύστημα δεν παίρνει απλώς εικόνες από κάπου, τις προσθέτει μαζί και βγάζει το αποτέλεσμα. Όχι, δημιουργούνται όλες οι «εικόνες» που προκύπτουν. Δηλαδή, το νευρωνικό δίκτυο «δημιουργεί» σαν πραγματικός καλλιτέχνης (ή ακόμα καλύτερα).

Προς το παρόν, το πρόγραμμα δεν είναι δωρεάν διαθέσιμο, αλλά σύντομα θα είναι δυνατή η δοκιμή του. Αυτό μπορεί να γίνει στο GPU Technology Conference 2019, το οποίο συμβαίνει αυτή τη στιγμή στην Καλιφόρνια. Οι τυχεροί που μπόρεσαν να επισκεφθούν την έκθεση μπορούν ήδη να δοκιμάσουν το GauGAN.

Τα νευρωνικά δίκτυα έχουν από καιρό διδαχθεί να συμμετέχουν στη δημιουργική διαδικασία. Για παράδειγμα, πέρυσι, μερικά από αυτά μπορούσε να δημιουργήσει τρισδιάστατα μοντέλα. Επιπλέον, προγραμματιστές από το DeepMind εκπαίδευσαν το νευρωνικό δίκτυο να ανακατασκευάζει τρισδιάστατους χώρους και αντικείμενα από σχέδια, φωτογραφίες και σκίτσα. Για να αναδημιουργηθεί μια απλή φιγούρα, το νευρωνικό δίκτυο χρειάζεται μια εικόνα· για να δημιουργήσει πιο σύνθετα αντικείμενα, απαιτούνται πέντε εικόνες για «εκπαίδευση».

Όσο για το GauGAN, αυτό το εργαλείο θα βρει σαφώς αξιόλογη εμπορική εφαρμογή - πολλοί τομείς των επιχειρήσεων και της επιστήμης έχουν ανάγκη για τέτοιες υπηρεσίες.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο