Aplikasyon yon sistèm aprantisaj machin pou sentèz imaj ki baze sou deskripsyon tèks

Yon aplikasyon louvri nan sistèm aprantisaj machin DALL-E 2, ki te pwopoze pa OpenAI, te pibliye epi li pèmèt ou fè sentèz imaj reyalis ak penti ki baze sou yon deskripsyon tèks nan lang natirèl, osi byen ke aplike kòmandman nan lang natirèl pou modifye imaj ( pou egzanp, ajoute, efase oswa deplase objè nan imaj la). Modèl orijinal DALL-E 2 OpenAI yo pa pibliye, men yon papye ki detaye metòd la disponib. Dapre deskripsyon ki deja egziste a, chèchè endepandan yo te prepare yon aplikasyon altènatif ekri an Python, lè l sèvi avèk fondasyon Pytorch la epi distribye anba lisans MIT.

Aplikasyon yon sistèm aprantisaj machin pou sentèz imaj ki baze sou deskripsyon tèksAplikasyon yon sistèm aprantisaj machin pou sentèz imaj ki baze sou deskripsyon tèks

Konpare ak aplikasyon an te pibliye deja nan premye jenerasyon DALL-E, nouvo vèsyon an bay yon matche pi egzak nan imaj la ak deskripsyon an, pèmèt pou pi gwo fotoréyalis ak fè li posib jenere imaj nan rezolisyon ki pi wo. Sistèm nan mande gwo resous pou antrene modèl la pou egzanp, fòmasyon vèsyon orijinal la nan DALL-E 2 mande pou 100-200 mil èdtan nan informatique sou GPU a, i.e. sou 2-4 semèn nan kalkil ak 256 NVIDIA Tesla V100 GPU.

Aplikasyon yon sistèm aprantisaj machin pou sentèz imaj ki baze sou deskripsyon tèks

Otè a menm tou te kòmanse devlope yon vèsyon pwolonje - DALLE2 Videyo, ki vize a sentèz videyo ki soti nan yon deskripsyon tèks. Separeman, nou ka sonje pwojè ru-dalle devlope pa Sberbank, ak yon aplikasyon louvri nan premye jenerasyon DALL-E, adapte pou rekonèt deskripsyon an Ris.

Sous: opennet.ru

Add nouvo kòmantè