Kev siv lub tshuab kev kawm rau cov duab synthesis raws li cov lus piav qhia

Kev qhib kev siv lub tshuab kev kawm DALL-E 2, tau thov los ntawm OpenAI, tau tshaj tawm thiab tso cai rau koj los tsim cov duab tiag tiag thiab cov duab kos raws li cov lus piav qhia hauv cov lus ntuj, nrog rau siv cov lus txib hauv cov lus ntuj los kho cov duab ( Piv txwv li, ntxiv, rho tawm lossis txav khoom hauv daim duab ). OpenAI tus thawj DALL-E 2 qauv tsis tau luam tawm, tab sis ib daim ntawv qhia txog txoj kev muaj. Raws li cov lus piav qhia uas twb muaj lawm, cov kws tshawb fawb ywj pheej tau npaj ib qho kev siv lwm txoj hauv kev sau hauv Python, siv Pytorg lub moj khaum thiab muab faib raws li MIT daim ntawv tso cai.

Kev siv lub tshuab kev kawm rau cov duab synthesis raws li cov lus piav qhiaKev siv lub tshuab kev kawm rau cov duab synthesis raws li cov lus piav qhia

Piv nrog rau qhov kev tshaj tawm yav dhau los ntawm kev siv thawj tiam ntawm DALL-E, tus tshiab version muab qhov tseeb dua ntawm cov duab rau cov lus piav qhia, tso cai rau ntau dua photorealism thiab ua rau nws muaj peev xwm tsim cov duab hauv kev daws teeb meem siab dua. Lub kaw lus xav tau cov peev txheej loj los cob qhia tus qauv; piv txwv li, kev cob qhia thawj version ntawm DALL-E 2 yuav tsum tau 100-200 txhiab teev ntawm kev suav ntawm GPU, piv txwv li. txog 2-4 lub lis piam ntawm kev suav nrog 256 NVIDIA Tesla V100 GPUs.

Kev siv lub tshuab kev kawm rau cov duab synthesis raws li cov lus piav qhia

Tib tus kws sau ntawv kuj tau pib tsim cov ntawv txuas ntxiv - DALLE2 Video, tsom rau kev tsim cov yeeb yaj kiab los ntawm cov lus piav qhia. Cais, peb tuaj yeem nco ntsoov qhov project ru-dalle tsim los ntawm Sberbank, nrog rau kev siv qhib thawj tiam DALL-E, yoog rau kev lees paub cov lus piav qhia hauv Lavxias.

Tau qhov twg los: opennet.ru

Ntxiv ib saib