NVIDIA hufungua msimbo kwa ajili ya mfumo wa kujifunza kwa mashine unaounganisha mandhari kutoka kwa michoro

NVIDIA imetoa msimbo wa chanzo kwa ajili ya mfumo wake wa kujifunza wa mashine ya SPADE (GauGAN), ambayo huunganisha mandhari halisi kutoka kwa michoro mbaya, pamoja na miundo inayohusiana ambayo haijafunzwa. Mfumo huo ulionyeshwa Machi katika mkutano wa GTC 2019, lakini kanuni hiyo ilitolewa jana. Kazi hii ni chanzo huria chini ya leseni ya Creative Commons Attribution-NonCommercial-ShareAlike 4.0 (CC BY-NC-SA 4.0), ambayo inaruhusu matumizi yasiyo ya kibiashara pekee. Nambari hiyo imeandikwa kwa Python kwa kutumia mfumo wa PyTorch.

 NVIDIA hufungua msimbo kwa ajili ya mfumo wa kujifunza kwa mashine unaounganisha mandhari kutoka kwa michoro

Michoro inawasilishwa kama ramani iliyogawanywa inayofafanua uwekaji wa takriban vitu kwenye eneo. Hali ya vitu vilivyotengenezwa hufafanuliwa kwa kutumia alama za rangi. Kwa mfano, kujaza bluu inakuwa anga, bluu inakuwa maji, kijani kibichi huwa miti, kijani kibichi huwa nyasi, hudhurungi huwa miamba, hudhurungi huwa milima, kijivu inakuwa theluji, mstari wa hudhurungi unakuwa barabara, na mstari wa bluu unakuwa mto. Zaidi ya hayo, mtindo wa jumla wa utungaji na wakati wa siku huamua kulingana na uteuzi wa picha za kumbukumbu. Zana hii ya kuunda ulimwengu pepe inaweza kuwa muhimu kwa wataalamu mbalimbali, kutoka kwa wasanifu majengo na wapangaji miji hadi watengenezaji wa michezo na wabunifu wa mazingira.

 NVIDIA hufungua msimbo kwa ajili ya mfumo wa kujifunza kwa mashine unaounganisha mandhari kutoka kwa michoro

Vipengee vimeunganishwa na mtandao wa neva wa adversarial (GAN), ambao huunda picha halisi kulingana na ramani iliyogawanywa, ikikopa maelezo kutoka kwa kielelezo kilichofunzwa awali kuhusu picha milioni kadhaa. Tofauti na mifumo ya usanisi ya picha iliyotengenezwa hapo awali, mbinu inayopendekezwa inategemea mabadiliko ya anga yanayofuatwa na mageuzi ya msingi ya kujifunza kwa mashine. Kuchakata ramani iliyogawanywa badala ya alama za kisemantiki huwezesha ulinganishaji sahihi wa matokeo na udhibiti wa mtindo.

 NVIDIA hufungua msimbo kwa ajili ya mfumo wa kujifunza kwa mashine unaounganisha mandhari kutoka kwa michoro

Ili kufikia uhalisia, mitandao miwili ya neva inashindana: jenereta na kibaguzi. Jenereta huzalisha picha kulingana na vipengele vya kuchanganya vya picha halisi, na kibaguzi hutambua uwezekano wa kupotoka kutoka kwa picha halisi. Matokeo yake, maoni yanaundwa, kwa misingi ambayo jenereta huanza kutunga sampuli zinazozidi bora zaidi mpaka kibaguzi ataacha kutofautisha kutoka kwa kweli.

Cheza video


Chanzo: opennet.ru

Kuongeza maoni