Implementaasje fan in masine-learsysteem foar ôfbyldingsynteze basearre op tekstbeskriuwing

In iepen ymplemintaasje fan it masine-learsysteem DALL-E 2, foarsteld troch OpenAI, is publisearre en lit jo realistyske ôfbyldings en skilderijen synthesisearje op basis fan in tekstbeskriuwing yn natuerlike taal, en ek kommando's tapasse yn natuerlike taal om ôfbyldings te bewurkjen ( bygelyks objekten tafoegje, wiskje of ferpleatse yn 'e ôfbylding). De orizjinele DALL-E 2-modellen fan OpenAI wurde net publisearre, mar in papier mei detaillearre de metoade is beskikber. Op grûn fan 'e besteande beskriuwing hawwe ûnôfhinklike ûndersikers in alternative ymplemintaasje taret skreaun yn Python, mei it Pytorch-ramt en ferspraat ûnder de MIT-lisinsje.

Implementaasje fan in masine-learsysteem foar ôfbyldingsynteze basearre op tekstbeskriuwingImplementaasje fan in masine-learsysteem foar ôfbyldingsynteze basearre op tekstbeskriuwing

Yn ferliking mei de earder publisearre ymplemintaasje fan 'e earste generaasje fan DALL-E, jout de nije ferzje in krekter oerienkomst fan' e ôfbylding oan 'e beskriuwing, makket it mooglik foar grutter fotorealisme en makket it mooglik om ôfbyldings yn hegere resolúsjes te generearjen. It systeem fereasket grutte boarnen om it model te trenen; bygelyks, training fan 'e orizjinele ferzje fan DALL-E 2 fereasket 100-200 tûzen oeren komputer op' e GPU, d.w.s. oer 2-4 wiken fan berekkeningen mei 256 NVIDIA Tesla V100 GPUs.

Implementaasje fan in masine-learsysteem foar ôfbyldingsynteze basearre op tekstbeskriuwing

Deselde auteur begon ek in útwreide ferzje te ûntwikkeljen - DALLE2 Video, rjochte op it synthesisearjen fan fideo fan in tekstbeskriuwing. Apart kinne wy ​​notearje it ru-dalle-projekt ûntwikkele troch Sberbank, mei in iepen ymplemintaasje fan 'e earste generaasje DALL-E, oanpast foar it werkennen fan beskriuwingen yn it Russysk.

Boarne: opennet.ru

Add a comment