စာသားဖော်ပြချက်အပေါ် အခြေခံ၍ ရုပ်ပုံပေါင်းစပ်ခြင်းအတွက် စက်သင်ယူမှုစနစ်အား အကောင်အထည်ဖော်ခြင်း။

OpenAI မှ အဆိုပြုထားသော DALL-E 2 ၏ ပွင့်လင်းသော အကောင်အထည်ဖော်မှုကို ထုတ်ဝေပြီး သဘာဝဘာသာစကားဖြင့် စာသားဖော်ပြချက်အပေါ် အခြေခံ၍ လက်တွေ့ဆန်သော ရုပ်ပုံများနှင့် ပန်းချီများကို ပေါင်းစပ်နိုင်စေသည့်အပြင် ပုံများကို တည်းဖြတ်ရန်အတွက် သဘာဝဘာသာစကားဖြင့် ညွှန်ကြားချက်များကို အသုံးချနိုင်သည် ( ဥပမာ၊ ပုံတွင် အရာဝတ္ထုများကို ထည့်ခြင်း၊ ဖျက်ခြင်း သို့မဟုတ် ရွှေ့ခြင်း)။ OpenAI ၏ မူရင်း DALL-E 2 မော်ဒယ်များကို မထုတ်ပြန်သော်လည်း နည်းလမ်းအသေးစိတ်ဖော်ပြသည့် စာရွက်ကို ရရှိနိုင်သည်။ ရှိပြီးသားဖော်ပြချက်အပေါ်အခြေခံ၍ လွတ်လပ်သောသုတေသီများသည် Python တွင်ရေးသားထားသောအခြားအကောင်အထည်ဖော်မှုတစ်ခုကို Pytorg မူဘောင်ကိုအသုံးပြု၍ MIT လိုင်စင်အောက်တွင်ဖြန့်ဝေထားသည်။

စာသားဖော်ပြချက်အပေါ် အခြေခံ၍ ရုပ်ပုံပေါင်းစပ်ခြင်းအတွက် စက်သင်ယူမှုစနစ်အား အကောင်အထည်ဖော်ခြင်း။စာသားဖော်ပြချက်အပေါ် အခြေခံ၍ ရုပ်ပုံပေါင်းစပ်ခြင်းအတွက် စက်သင်ယူမှုစနစ်အား အကောင်အထည်ဖော်ခြင်း။

DALL-E ၏ ပထမမျိုးဆက်ကို ယခင်ထုတ်ဝေခဲ့သည့် အကောင်အထည်ဖော်မှုနှင့် နှိုင်းယှဉ်ပါက၊ ဗားရှင်းအသစ်သည် ပုံ၏ဖော်ပြချက်နှင့် ပိုမိုတိကျသောကိုက်ညီမှုကို ပေးစွမ်းနိုင်ပြီး ပိုမိုကြီးမားသောဓာတ်ပုံအစစ်အမှန်ကို ရရှိစေကာ ပိုမိုမြင့်မားသော resolution များဖြင့် ပုံများကို ဖန်တီးနိုင်စေသည်။ စနစ်သည် မော်ဒယ်ကိုလေ့ကျင့်ရန်အတွက် ကြီးမားသောအရင်းအမြစ်များ လိုအပ်သည်၊ ဥပမာ၊ DALL-E 2 ၏မူရင်းဗားရှင်းကို လေ့ကျင့်သင်ကြားပေးခြင်းသည် GPU ပေါ်တွင် တွက်ချက်ချိန် နာရီပေါင်း 100-200 လိုအပ်သည်။ 2 NVIDIA Tesla V4 GPUs ဖြင့် တွက်ချက်မှု 256-100 ပတ်ခန့်။

စာသားဖော်ပြချက်အပေါ် အခြေခံ၍ ရုပ်ပုံပေါင်းစပ်ခြင်းအတွက် စက်သင်ယူမှုစနစ်အား အကောင်အထည်ဖော်ခြင်း။

အလားတူ စာရေးဆရာသည် စာသားဖော်ပြချက်မှ ဗီဒီယိုကို ပေါင်းစပ်ဖန်တီးရန် ရည်ရွယ်သည့် တိုးချဲ့ဗားရှင်း - DALLLE2 Video ကို စတင်တီထွင်ခဲ့သည်။ သီးခြားအားဖြင့်၊ ရုရှားဘာသာဖြင့် ဖော်ပြချက်များကို အသိအမှတ်ပြုရန်အတွက် လိုက်လျောညီထွေဖြစ်သော ပထမမျိုးဆက် DALL-E ကို ပွင့်လင်းစွာ အကောင်အထည်ဖော်ခြင်းဖြင့် Sberbank မှ တီထွင်ထားသော ru-dalle ပရောဂျက်ကို ကျွန်ုပ်တို့ မှတ်သားနိုင်ပါသည်။

source: opennet.ru

မှတ်ချက် Add