د متن تشریح پر بنسټ د انځور ترکیب لپاره د ماشین زده کړې سیسټم پلي کول

د ماشین زده کړې سیسټم DALL-E 2 خلاص پلي کول ، د OpenAI لخوا وړاندیز شوی ، خپور شوی او تاسو ته اجازه درکوي په طبیعي ژبه کې د متن توضیحاتو پراساس ریښتیني عکسونه او نقاشي ترکیب کړئ ، او همدارنګه د عکسونو سمولو لپاره په طبیعي ژبه کې حکمونه پلي کړئ ( د مثال په توګه، په عکس کې شیان اضافه کول، حذف کول یا حرکت کول). د OpenAI اصلي DALL-E 2 ماډلونه ندي خپاره شوي، مګر د میتود توضیح کولو یوه مقاله شتون لري. د موجوده توضیحاتو پراساس ، خپلواک څیړونکو د Pytorch چوکاټ په کارولو سره په Python کې لیکل شوي بدیل پلي کول چمتو کړي او د MIT جواز لاندې ویشل شوي.

د متن تشریح پر بنسټ د انځور ترکیب لپاره د ماشین زده کړې سیسټم پلي کولد متن تشریح پر بنسټ د انځور ترکیب لپاره د ماشین زده کړې سیسټم پلي کول

د DALL-E د لومړي نسل د مخکیني خپاره شوي پلي کولو په پرتله، نوې نسخه د توضیحاتو لپاره د عکس خورا دقیق میچ چمتو کوي، د لوی فوټوریالیزم لپاره اجازه ورکوي او دا امکان ورکوي چې په لوړو ریزولوشنونو کې عکسونه رامینځته کړي. سیسټم د ماډل روزلو لپاره لویو سرچینو ته اړتیا لري؛ د بیلګې په توګه، د DALL-E 2 اصلي نسخه روزنه په GPU کې 100-200 زره ساعته کمپیوټر ته اړتیا لري، د بیلګې په توګه. د 2 NVIDIA Tesla V4 GPUs سره د 256-100 اونیو حسابونو په اړه.

د متن تشریح پر بنسټ د انځور ترکیب لپاره د ماشین زده کړې سیسټم پلي کول

ورته لیکوال هم د یوې پراخې نسخې رامینځته کول پیل کړل - DALLE2 ویډیو چې هدف یې د متن توضیحاتو څخه ویډیو ترکیب کول دي. په جلا توګه، موږ کولی شو د ru-dalle پروژه یادونه وکړو چې د سبربینک لخوا رامینځته شوې، د لومړي نسل DALL-E په خلاص پلي کولو سره، په روسیه کې د توضیحاتو پیژندلو لپاره تطبیق شوی.

سرچینه: opennet.ru

Add a comment