NVIDIA рамзи системаи омӯзиши мошинро мекушояд, ки манзараро аз эскизҳо синтез мекунад

Ширкати NVIDIA нашр шудааст кодҳои сарчашмаи системаи омӯзиши мошинсозӣ СУЛХ (GauGAN), ки ба шумо имкон медиҳад, ки манзараҳои воқеиро дар асоси эскизҳои ноҳамвор, инчунин онҳое, ки бо лоиҳа алоқаманданд, синтез кунед. моделҳои таълим. Система буд намоиш дод моҳи март дар конфронси GTC 2019, аммо код танҳо дирӯз нашр шуд. Тараккиёти кушодан дар асоси иҷозатномаи моликият CC BY-NC-SA 4.0 (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), танҳо барои истифодаи ғайритиҷоратӣ иҷозат медиҳад. Рамз дар Python бо истифода аз чаҳорчӯба навишта шудааст PyTorch.

NVIDIA рамзи системаи омӯзиши мошинро мекушояд, ки манзараро аз эскизҳо синтез мекунад

Эскизҳо дар шакли харитаи сегментӣ тартиб дода мешаванд, ки ҷойгиршавии объектҳои тахминиро дар ҷои ҳодиса муайян мекунад. Хусусияти объектҳои тавлидшуда бо истифода аз аломатҳои ранг муайян карда мешавад. Масалан, пури кабуд ба осмон, кабуд ба об, сабзи тира ба дарахт, сабзи равшан ба алаф, қаҳваранги равшан ба санг, қаҳваранги тира ба кӯҳ, хокистарӣ ба барф, хати қаҳваранг ба роҳ ва кабуд табдил меёбад. хат ба дарё Илова бар ин, дар асоси интихоби тасвирҳои истинод, услуби умумии таркиб ва вақти рӯз муайян карда мешавад. Воситаи пешниҳодшуда барои эҷоди ҷаҳони виртуалӣ метавонад барои доираи васеи мутахассисон, аз меъморон ва шаҳрсозон то таҳиягарони бозӣ ва тарроҳони ландшафт муфид бошад.

NVIDIA рамзи системаи омӯзиши мошинро мекушояд, ки манзараро аз эскизҳо синтез мекунад

Объектҳо аз ҷониби шабакаи нейронии генеративии муқобил синтез карда мешаванд (GAN), ки дар асоси харитаи тақсимшудаи схематикӣ тасвирҳои воқеиро эҷод мекунад ва тафсилотро аз моделе, ки дар якчанд миллион аксҳои пешакӣ омӯзонида шудааст, мегирад. Баръакси системаҳои синтези тасвирҳои қаблан таҳияшуда, усули пешниҳодшуда ба истифодаи табдилдиҳии фазоии мутобиқшавӣ ва пас аз трансформатсия дар асоси омӯзиши мошин асос ёфтааст. Коркарди харитаи сегментӣ ба ҷои аломатгузории семантикӣ ба шумо имкон медиҳад, ки натиҷаҳои дақиқи мувофиқат ба даст оред ва услубро назорат кунед.

NVIDIA рамзи системаи омӯзиши мошинро мекушояд, ки манзараро аз эскизҳо синтез мекунад

Барои ноил шудан ба воқеият, ду шабакаи нейронӣ бо ҳамдигар рақобат мекунанд: генератор ва дискриминатор. Генератор дар асоси омезиши унсурҳои аксҳои воқеӣ тасвирҳоро тавлид мекунад ва дискриминатор инҳирофҳои эҳтимолиро аз тасвирҳои воқеӣ муайян мекунад. Дар натиҷа, фикру мулоҳизаҳо ташаккул меёбанд, ки дар асоси он генератор ба эҷод кардани намунаҳои торафт беҳтар шурӯъ мекунад, то даме ки дискриминатор онҳоро аз воқеият фарқ намекунад.

Манбаъ: opennet.ru

Илова Эзоҳ