NVIDIA нь ноорогоос ландшафтыг нэгтгэдэг машин сургалтын системийн кодыг нээдэг

NVIDIA компани Нийтлэгдсэн машин сургалтын системийн эх кодууд ХУВЬЦАА (GauGAN), энэ нь бүдүүлэг тойм зураг, түүнчлэн төсөлтэй холбоотой бодит ландшафтуудыг нэгтгэх боломжийг олгодог. бэлтгэгдсэн загварууд. Систем нь байсан үзүүлсэн 2019-р сард GTC XNUMX бага хурал дээр болсон боловч кодыг өчигдөр нийтэлсэн. Хөгжил нээлттэй өмчийн лицензийн дагуу CC BY-NC-SA 4.0 (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), зөвхөн арилжааны бус зорилгоор ашиглахыг зөвшөөрдөг. Код нь Python дээр фреймворк ашиглан бичигдсэн ПиТорч.

NVIDIA нь ноорогоос ландшафтыг нэгтгэдэг машин сургалтын системийн кодыг нээдэг

Ноорог зургийг хэсэгчилсэн газрын зураг хэлбэрээр зурсан бөгөөд энэ нь үзэгдэл дээр ойролцоох объектуудын байршлыг тодорхойлдог. Үүсгэсэн объектын шинж чанарыг өнгөт тэмдэглэгээг ашиглан тодорхойлно. Жишээ нь: цэнхэр дүүргэлт нь тэнгэрт, хөх нь ус, хар ногоон нь мод, цайвар ногоон нь өвс, цайвар хүрэн нь хад, хар хүрэн нь уулс, саарал нь цас, бор шугам нь зам, хөх гол руу шугам Нэмж дурдахад, жишиг зургийн сонголт дээр үндэслэн найруулгын ерөнхий хэв маяг, өдрийн цагийг тодорхойлдог. Санал болгож буй виртуал ертөнцийг бий болгох хэрэгсэл нь архитектор, хот төлөвлөлтөөс эхлээд тоглоом хөгжүүлэгчид, ландшафтын дизайнерууд хүртэл өргөн хүрээний мэргэжилтнүүдэд хэрэг болно.

NVIDIA нь ноорогоос ландшафтыг нэгтгэдэг машин сургалтын системийн кодыг нээдэг

Объектуудыг үүсгэгч сөрөг мэдрэлийн сүлжээгээр нэгтгэдэг.GAN), хэд хэдэн сая гэрэл зураг дээр урьдчилан бэлтгэсэн загвараас дэлгэрэнгүй мэдээллийг авч, бүдүүвч сегментчилсэн газрын зураг дээр үндэслэн бодит зургийг бүтээдэг. Өмнө нь боловсруулсан зургийн синтезийн системээс ялгаатай нь санал болгож буй арга нь дасан зохицох орон зайн хувиргалт, дараа нь машин сургалтанд суурилсан хувиргалтыг ашиглахад суурилдаг. Семантик тэмдэглэгээний оронд сегментчилсэн газрын зургийг боловсруулах нь яг таарч тохирох үр дүнд хүрч, хэв маягийг хянах боломжийг олгоно.

NVIDIA нь ноорогоос ландшафтыг нэгтгэдэг машин сургалтын системийн кодыг нээдэг

Бодит байдалд хүрэхийн тулд хоёр мэдрэлийн сүлжээ хоорондоо өрсөлддөг: генератор ба ялгагч. Генератор нь бодит гэрэл зургийн элементүүдийг холих үндсэн дээр дүрсийг үүсгэдэг бөгөөд ялгагч нь бодит зургуудаас болзошгүй хазайлтыг тодорхойлдог. Үүний үр дүнд санал хүсэлт үүсдэг бөгөөд үүний үндсэн дээр генератор нь ялгаварлагч нь бодит байдлаас нь ялгахаа болих хүртэл илүү сайн дээжийг бүрдүүлж эхэлдэг.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх