Pêkanîna pergalek fêrbûna makîneyê ji bo senteza wêneyê li ser bingeha ravekirina nivîsê

Pêkanîna vekirî ya pergala fêrbûna makîneyê DALL-E 2, ku ji hêla OpenAI ve hatî pêşniyar kirin, hate weşandin û dihêle hûn wêne û tabloyên realîst li ser bingeha danasîna nivîsê ya bi zimanê xwezayî sentez bikin, û her weha fermanên bi zimanê xwezayî bicîh bikin da ku wêneyan biguherînin ( wek nimûne, tiştên di wêneyê de zêde bikin, jêbikin an biguhezînin). Modelên orjînal ên OpenAI DALL-E 2 nayên weşandin, lê kaxezek ku bi hûrgulî rêbazê vedibêje heye. Li ser bingeha danasîna heyî, lêkolînerên serbixwe pêkanînek alternatîf a ku bi Python hatî nivîsandin, bi karanîna çarçoweya Pytorch ve hatî nivîsandin û di bin lîsansa MIT de belav kirin, amade kirin.

Pêkanîna pergalek fêrbûna makîneyê ji bo senteza wêneyê li ser bingeha ravekirina nivîsêPêkanîna pergalek fêrbûna makîneyê ji bo senteza wêneyê li ser bingeha ravekirina nivîsê

Li gorî pêkanîna berê ya ku ji nifşa yekem a DALL-E-yê hatî weşandin, guhertoya nû lihevhatinek rastîn a wêneyê bi ravekirinê re peyda dike, rê dide fotorealîzma mezintir û dihêle ku hûn wêneyan bi rezîliyên bilindtir çêbikin. Pergal ji bo perwerdekirina modelê çavkaniyên mezin hewce dike; Mînakî, perwerdekirina guhertoya orîjînal a DALL-E 2 hewceyê 100-200 hezar demjimêran li ser GPU-yê hesab dike, yanî. bi qasî 2-4 hefteyên hesabên bi 256 GPU-yên NVIDIA Tesla V100.

Pêkanîna pergalek fêrbûna makîneyê ji bo senteza wêneyê li ser bingeha ravekirina nivîsê

Heman nivîskar di heman demê de dest bi pêşdebirina guhertoyek dirêjkirî - DALLE2 Vîdyo, kir ku armanc ew e ku vîdyoyê ji ravekek nivîsê berhev bike. Ji hev veqetandî, em dikarin projeya ru-dalle ya ku ji hêla Sberbank ve hatî pêşve xistin, bi pêkanîna vekirî ya nifşa yekem DALL-E, ku ji bo naskirina danasînên bi rûsî hatî adaptekirin, destnîşan bikin.

Source: opennet.ru

Add a comment