Mifumo ya mashine ya kujifunza kwa usanisi wa picha na kupunguza kelele katika picha za usiku

Uthabiti AI imechapisha modeli zilizotengenezwa tayari za mfumo wa kujifunza wa mashine ya Usambazaji Imara, wenye uwezo wa kuunganisha na kurekebisha picha kulingana na maelezo ya maandishi katika lugha asilia. Miundo imepewa leseni chini ya leseni ya Creative ML OpenRAIL-M inayoruhusiwa kwa matumizi ya kibiashara. Ili kutoa mafunzo kwa mfumo huu, kundi la 4000 NVIDIA A100 Ezra-1 GPUs na mkusanyiko wa LAION-5B, ikijumuisha picha bilioni 5.85 zenye maelezo ya maandishi, zilitumika. Hapo awali, msimbo wa zana za kufunza mtandao wa neva na kutoa picha ulikuwa wazi chini ya leseni ya MIT.

Upatikanaji wa modeli iliyotengenezwa tayari na mahitaji ya mfumo wa wastani ambayo huruhusu mtu kuanza majaribio kwenye Kompyuta yenye GPU za kawaida yamesababisha kuibuka kwa idadi ya miradi inayohusiana:

  • maandishi-inversion (code) - nyongeza ambayo inakuwezesha kuunganisha picha na tabia fulani, kitu au mtindo. Katika Mgawanyiko Asili Imara, vitu katika picha zilizosanisi ni nasibu na havidhibitiki. Nyongeza iliyopendekezwa hukuruhusu kuongeza vitu vyako vya kuona, kuvifunga kwa maneno muhimu na kuzitumia katika usanisi.

    Kwa mfano, katika Diffusion ya kawaida ya Imara unaweza kuuliza mfumo wa kuzalisha picha na "paka katika mashua". Zaidi ya hayo, unaweza kufafanua sifa za paka na mashua, lakini haitabiriki ambayo paka na mashua zitaunganishwa. Ubadilishaji wa maandishi hukuruhusu kufunza mfumo kwa picha ya paka au mashua yako na kuunganisha picha na paka au mashua maalum. Vivyo hivyo, inaweza pia kuchukua nafasi ya vitu vya picha na vitu fulani, kuweka mfano wa mtindo wa kuona kwa usanisi, na kutaja dhana (kwa mfano, kutoka kwa anuwai ya madaktari, unaweza kutumia uteuzi sahihi zaidi na wa hali ya juu. kwa mtindo uliotaka).

    Mifumo ya mashine ya kujifunza kwa usanisi wa picha na kupunguza kelele katika picha za usiku

  • stable-diffusion-animation - uundaji wa picha za uhuishaji (zinazosonga) kulingana na tafsiri kati ya picha zinazozalishwa katika Usambazaji Imara.
  • stable_diffusion.openvino (code) - bandari ya Usambazaji Imara, ambayo hutumia tu CPU kwa mahesabu, ambayo inaruhusu majaribio kwenye mifumo isiyo na GPU yenye nguvu. Inahitaji kichakataji kinachotumika katika maktaba ya OpenVINO. Rasmi, OpenVINO hutoa programu jalizi kwa vichakataji vya Intel na viendelezi vya AVX2, AVX-512, AVX512_BF16 na SSE, na vile vile kwa Raspberry Pi 4 Model B, Apple Mac mini na bodi za NVIDIA Jetson Nano. Kwa njia isiyo rasmi, inawezekana kutumia OpenVINO kwenye wasindikaji wa AMD Ryzen.
  • sdamd ni bandari ya AMD GPU.
  • Utekelezaji wa awali wa usanisi wa video.
  • stable-diffusion-gui, stable-diffusion-ui, Artbreeder Collage, diffuse-the-rest - miingiliano ya kielelezo ya kutengeneza picha kwa kutumia Usambazaji Imara.
  • beta.dreamstudio.ai, Nafasi za Kukumbatiana za Uso, hlky Wavuti ya Usambazaji Imara - miingiliano ya wavuti kwa usanisi wa picha kwa kutumia Usambazaji Imara.
  • Programu-jalizi za kuunganisha Usambazaji Imara na GIMP, Figma, Blender na Photoshop.

Zaidi ya hayo, tunaweza kuona uchapishaji wa Google wa msimbo wa mfumo wa kujifunza mashine wa RawNeRF (RAW Neural Radiance Fields), unaoruhusu, kulingana na data kutoka kwa picha kadhaa za RAW, kuboresha ubora wa picha zenye kelele nyingi zinazopigwa gizani na ndani. taa mbaya. Mbali na kuondoa kelele, zana zilizotengenezwa na mradi huo hufanya iwezekanavyo kuongeza maelezo, kuondoa glare, kuunganisha HDR na kubadilisha taa ya jumla kwenye picha, na pia kuunda tena nafasi ya tatu ya vitu kwa kutumia picha kadhaa kutoka pembe tofauti, badilisha mtazamo, dhibiti umakini na toa picha zinazosonga.

Mifumo ya mashine ya kujifunza kwa usanisi wa picha na kupunguza kelele katika picha za usiku
Mifumo ya mashine ya kujifunza kwa usanisi wa picha na kupunguza kelele katika picha za usiku


Chanzo: opennet.ru

Kuongeza maoni