Mạng thần kinh Nvidia biến những bản phác thảo đơn giản thành những phong cảnh tuyệt đẹp

Mạng thần kinh Nvidia biến những bản phác thảo đơn giản thành những phong cảnh tuyệt đẹp
Thác của người hút thuốc và thác của người khỏe mạnh

Chúng ta đều biết làm thế nào để vẽ một con cú. Đầu tiên, bạn cần vẽ một hình bầu dục, sau đó là một hình tròn khác, và sau đó - bạn sẽ có được một con cú tuyệt đẹp. Tất nhiên, đây là một trò đùa và là một trò đùa rất cũ, nhưng các kỹ sư của Nvidia đã cố gắng biến điều tưởng tượng thành sự thật.

Sự phát triển mới, được gọi là GauGAN, tạo ra những cảnh quan tuyệt đẹp từ những bản phác thảo rất đơn giản (thực sự đơn giản - hình tròn, đường kẻ và tất cả). Tất nhiên, sự phát triển này dựa trên các công nghệ hiện đại - cụ thể là mạng lưới thần kinh đối nghịch chung.

GauGAN cho phép bạn tạo ra những thế giới ảo đầy màu sắc - và không chỉ để giải trí mà còn cho công việc. Vì vậy, kiến ​​​​trúc sư, nhà thiết kế cảnh quan, nhà phát triển trò chơi - tất cả họ đều có thể học được điều gì đó hữu ích. Trí tuệ nhân tạo ngay lập tức “hiểu” những gì một người muốn và bổ sung cho ý tưởng ban đầu với một lượng lớn chi tiết.

Một nhà phát triển GauGAN cho biết: “Động não về phát triển thiết kế dễ dàng hơn nhiều với sự trợ giúp của GauGAN, vì bút vẽ thông minh có thể bổ sung cho bản phác thảo ban đầu bằng cách thêm hình ảnh chất lượng”.

Người dùng công cụ này có thể thay đổi ý tưởng ban đầu, sửa đổi phong cảnh hoặc hình ảnh khác, thêm bầu trời, cát, biển, v.v. Mọi thứ mà trái tim bạn mong muốn và việc bổ sung chỉ mất vài giây.

Mạng thần kinh được đào tạo bằng cách sử dụng cơ sở dữ liệu gồm hàng triệu hình ảnh. Nhờ đó, hệ thống có thể hiểu một người muốn gì và làm thế nào để đạt được điều họ muốn. Hơn nữa, mạng lưới thần kinh không quên những chi tiết nhỏ nhất. Vì vậy, nếu bạn vẽ sơ đồ một cái ao và một số cây bên cạnh nó, thì sau khi cảnh quan được hồi sinh, tất cả các vật thể gần đó sẽ được phản chiếu trong gương của nước ao.

Bạn có thể cho hệ thống biết bề mặt nhìn thấy được là gì - nó có thể được bao phủ bởi cỏ, tuyết, nước hoặc cát. Tất cả điều này có thể được biến đổi trong một giây, để tuyết trở thành cát và thay vì một vùng đất hoang đầy tuyết, nghệ sĩ có được một phong cảnh sa mạc.

“Nó giống như một cuốn sách tô màu cho biết nên đặt cái cây ở đâu, mặt trời ở đâu và bầu trời ở đâu. Sau đó, sau nhiệm vụ ban đầu, mạng lưới thần kinh sẽ tạo hoạt ảnh cho bức tranh, thêm các chi tiết và kết cấu cần thiết, vẽ phản chiếu. Tất cả điều này dựa trên hình ảnh thực tế,” một trong những nhà phát triển cho biết.


Mặc dù hệ thống thiếu "sự hiểu biết" về thế giới thực, nhưng hệ thống này tạo ra những cảnh quan ấn tượng. Điều này là do hai mạng thần kinh được sử dụng ở đây, một bộ tạo và một bộ phân biệt. Trình tạo tạo một hình ảnh và hiển thị nó cho bộ phân biệt đối xử. Anh ấy, dựa trên hàng triệu hình ảnh đã xem trước đó, chọn các tùy chọn thực tế nhất.

Đó là lý do tại sao trình tạo "biết" vị trí của các phản xạ. Điều đáng chú ý là công cụ này rất linh hoạt và được trang bị một số lượng lớn các cài đặt. Vì vậy, với nó, bạn có thể vẽ, điều chỉnh theo phong cách của một nghệ sĩ cụ thể hoặc chỉ chơi xung quanh với việc bổ sung nhanh cảnh bình minh hoặc hoàng hôn.

Các nhà phát triển tuyên bố rằng hệ thống không chỉ lấy hình ảnh từ một nơi nào đó, thêm chúng lại với nhau và nhận kết quả. Không, tất cả "hình ảnh" nhận được đều được tạo. Tức là mạng thần kinh “tạo ra” giống như một nghệ sĩ thực thụ (hoặc thậm chí tốt hơn).

Cho đến nay, chương trình không có sẵn miễn phí, nhưng sẽ sớm có thể thử nghiệm nó trong công việc. Điều này có thể được thực hiện tại Hội nghị Công nghệ GPU 2019, hiện đang diễn ra ở California. Những người may mắn được tham quan triển lãm đã có thể thử nghiệm GauGAN.

Mạng lưới thần kinh từ lâu đã được dạy để tham gia vào quá trình sáng tạo. Ví dụ, năm ngoái, một số người trong số họ có thể tạo mô hình 3D. Ngoài ra, các nhà phát triển từ DeepMind đã đào tạo mạng lưới thần kinh để khôi phục không gian và đối tượng ba chiều từ các bản vẽ, ảnh chụp và bản phác thảo. Để tạo lại một hình đơn giản, mạng nơ-ron cần một hình ảnh; để tạo ra các đối tượng phức tạp hơn, cần có năm hình ảnh để “đào tạo”.

Đối với GauGAN, công cụ này rõ ràng sẽ tìm thấy một ứng dụng thương mại xứng đáng - nhiều lĩnh vực kinh doanh và khoa học có nhu cầu về các dịch vụ như vậy.

Nguồn: www.habr.com

Thêm một lời nhận xét