Cur i bhfeidhm córas meaisínfhoghlama do shintéis íomhá bunaithe ar thuairisc téacs

Foilsíodh cur i bhfeidhm oscailte an chórais meaisínfhoghlama DALL-E 2, atá molta ag OpenAI, agus ligeann sé duit íomhánna agus pictiúir réadúla a shintéisiú bunaithe ar thuairisc téacs i dteanga nádúrtha, chomh maith le horduithe i dteanga nádúrtha a chur i bhfeidhm chun íomhánna a chur in eagar ( mar shampla, cuir leis, scrios nó bog rudaí san íomhá ). Ní fhoilsítear múnlaí bunaidh DALL-E 2 OpenAI, ach tá páipéar a shonraíonn an modh ar fáil. Bunaithe ar an gcur síos atá ann cheana féin, d'ullmhaigh taighdeoirí neamhspleácha cur chun feidhme eile scríofa i Python, ag baint úsáide as creat Pytorch agus a dháileadh faoi cheadúnas MIT.

Cur i bhfeidhm córas meaisínfhoghlama do shintéis íomhá bunaithe ar thuairisc téacsCur i bhfeidhm córas meaisínfhoghlama do shintéis íomhá bunaithe ar thuairisc téacs

I gcomparáid le cur i bhfeidhm an chéad ghlúin DALL-E a foilsíodh roimhe seo, soláthraíonn an leagan nua meaitseáil níos cruinne idir an íomhá agus an tuairisc, ceadaíonn sé níos mó fótarealism agus is féidir íomhánna a ghiniúint i rúin níos airde. Éilíonn an córas acmhainní móra chun an tsamhail a oiliúint; mar shampla, éilíonn oiliúint an bhunleagan de DALL-E 2 100-200 míle uair an chloig de ríomhaireacht ar an GPU, i.e. thart ar 2-4 seachtaine de ríomhanna le 256 NVIDIA Tesla V100 GPUs.

Cur i bhfeidhm córas meaisínfhoghlama do shintéis íomhá bunaithe ar thuairisc téacs

Thosaigh an t-údar céanna ag forbairt leagan leathnaithe freisin - DALLE2 Video, dírithe ar fhíseán a shintéisiú ó thuairisc téacs. Ar leithligh, is féidir linn an tionscadal ru-dalle forbartha ag Sberbank a thabhairt faoi deara, le cur i bhfeidhm oscailte den chéad ghlúin DALL-E, arna oiriúnú chun tuairiscí a aithint i Rúisis.

Foinse: oscailtenet.ru

Add a comment