Ṣiṣe eto ẹkọ ẹrọ kan fun iṣelọpọ aworan ti o da lori apejuwe ọrọ

Imuse ṣiṣi ti eto ẹkọ ẹrọ DALL-E 2, ti o dabaa nipasẹ OpenAI, ti ṣe atẹjade ati gba ọ laaye lati ṣajọpọ awọn aworan ati awọn aworan ti o da lori apejuwe ọrọ ni ede adayeba, ati lo awọn aṣẹ ni ede adayeba lati satunkọ awọn aworan ( fun apẹẹrẹ, ṣafikun, paarẹ tabi gbe awọn nkan ninu aworan). Awọn awoṣe DALL-E 2 atilẹba ti OpenAI ko ṣe atẹjade, ṣugbọn iwe ti n ṣalaye ọna naa wa. Da lori apejuwe ti o wa tẹlẹ, awọn oniwadi ominira ti pese imuse yiyan ti a kọ sinu Python, ni lilo ilana Pytorch ati pinpin labẹ iwe-aṣẹ MIT.

Ṣiṣe eto ẹkọ ẹrọ kan fun iṣelọpọ aworan ti o da lori apejuwe ọrọṢiṣe eto ẹkọ ẹrọ kan fun iṣelọpọ aworan ti o da lori apejuwe ọrọ

Ti a ṣe afiwe si imuse ti a tẹjade tẹlẹ ti iran akọkọ ti DALL-E, ẹya tuntun n pese ibaramu deede diẹ sii ti aworan si apejuwe, ngbanilaaye fun fọtoyiya nla ati jẹ ki o ṣee ṣe lati ṣe awọn aworan ni awọn ipinnu giga. Eto naa nilo awọn orisun nla lati ṣe ikẹkọ awoṣe; fun apẹẹrẹ, ikẹkọ ẹya atilẹba ti DALL-E 2 nilo awọn wakati 100-200 ẹgbẹrun ti iširo lori GPU, ie. nipa 2-4 ọsẹ ti isiro pẹlu 256 NVIDIA Tesla V100 GPUs.

Ṣiṣe eto ẹkọ ẹrọ kan fun iṣelọpọ aworan ti o da lori apejuwe ọrọ

Onkọwe kanna tun bẹrẹ idagbasoke ẹya ti o gbooro sii - DALLE2 Fidio, ti o ni ero lati ṣajọpọ fidio lati apejuwe ọrọ kan. Lọtọ, a le ṣe akiyesi iṣẹ-ṣiṣe ru-dalle ti o ni idagbasoke nipasẹ Sberbank, pẹlu imuse ṣiṣi ti iran akọkọ DALL-E, ti a ṣe atunṣe fun idanimọ awọn apejuwe ni Russian.

orisun: opennet.ru

Fi ọrọìwòye kun