Aiwatar da tsarin koyan na'ura don haɗa hoto bisa bayanin rubutu

Buɗe aiwatar da tsarin koyon injin DALL-E 2, wanda OpenAI ya gabatar, an buga shi kuma yana ba ku damar haɗa hotuna da zane na zahiri dangane da bayanin rubutu a cikin yare na halitta, da kuma amfani da umarni cikin yaren yanayi don shirya hotuna ( misali, ƙara, share ko matsar da abubuwa a cikin hoton). Ba a buga ainihin ƙirar DALL-E 2 na OpenAI ba, amma akwai takarda da ke bayyana hanyar. Dangane da bayanin da ake da shi, masu bincike masu zaman kansu sun shirya madadin aiwatarwa da aka rubuta a cikin Python, ta amfani da tsarin Pytorch kuma an rarraba su ƙarƙashin lasisin MIT.

Aiwatar da tsarin koyan na'ura don haɗa hoto bisa bayanin rubutuAiwatar da tsarin koyan na'ura don haɗa hoto bisa bayanin rubutu

Idan aka kwatanta da aiwatar da aiwatar da ƙarni na farko na DALL-E a baya, sabon sigar ta samar da daidaitaccen madaidaicin hoton zuwa bayanin, yana ba da damar haɓakar hoto mai girma kuma yana ba da damar samar da hotuna a cikin ƙuduri mafi girma. Tsarin yana buƙatar manyan albarkatu don horar da ƙirar; misali, horar da ainihin sigar DALL-E 2 yana buƙatar awoyi dubu 100-200 na ƙididdigewa akan GPU, watau. game da makonni 2-4 na lissafi tare da 256 NVIDIA Tesla V100 GPUs.

Aiwatar da tsarin koyan na'ura don haɗa hoto bisa bayanin rubutu

Wannan marubucin ya kuma fara haɓaka wani tsawaita sigar - DALLE2 Bidiyo, da nufin haɗa bidiyo daga bayanin rubutu. Na dabam, zamu iya lura da aikin ru-dalle wanda Sberbank ya haɓaka, tare da buɗe aikace-aikacen farko na DALL-E, wanda aka daidaita don gane kwatancen cikin Rashanci.

source: budenet.ru

Add a comment