Buɗe aiwatar da tsarin koyon injin DALL-E 2, wanda OpenAI ya gabatar, an buga shi kuma yana ba ku damar haɗa hotuna da zane na zahiri dangane da bayanin rubutu a cikin yare na halitta, da kuma amfani da umarni cikin yaren yanayi don shirya hotuna ( misali, ƙara, share ko matsar da abubuwa a cikin hoton). Ba a buga ainihin ƙirar DALL-E 2 na OpenAI ba, amma akwai takarda da ke bayyana hanyar. Dangane da bayanin da ake da shi, masu bincike masu zaman kansu sun shirya madadin aiwatarwa da aka rubuta a cikin Python, ta amfani da tsarin Pytorch kuma an rarraba su ƙarƙashin lasisin MIT.
Idan aka kwatanta da aiwatar da aiwatar da ƙarni na farko na DALL-E a baya, sabon sigar ta samar da daidaitaccen madaidaicin hoton zuwa bayanin, yana ba da damar haɓakar hoto mai girma kuma yana ba da damar samar da hotuna a cikin ƙuduri mafi girma. Tsarin yana buƙatar manyan albarkatu don horar da ƙirar; misali, horar da ainihin sigar DALL-E 2 yana buƙatar awoyi dubu 100-200 na ƙididdigewa akan GPU, watau. game da makonni 2-4 na lissafi tare da 256 NVIDIA Tesla V100 GPUs.
Wannan marubucin ya kuma fara haɓaka wani tsawaita sigar - DALLE2 Bidiyo, da nufin haɗa bidiyo daga bayanin rubutu. Na dabam, zamu iya lura da aikin ru-dalle wanda Sberbank ya haɓaka, tare da buɗe aikace-aikacen farko na DALL-E, wanda aka daidaita don gane kwatancen cikin Rashanci.
source: budenet.ru