ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

He mea ʻakaʻaka ke ʻano o ka mōʻaukala hoʻokuʻu ʻana o nā kumu hoʻohālike open-source no ka hoʻololi ʻana i nā ʻōkuhi kikokikona i nā kiʻi, i hoʻomohala ʻia a hoʻomaʻamaʻa ʻia e Stability AI, e like me ke kaʻina o nā piʻi a me nā iho o nā hoʻokuʻu ʻana o Microsoft OS. Ma hope o ka holomua kaulana o XP, e hoʻomanaʻo kākou, ua hiki mai ka Vista pilikia; a laila ka Windows 7 nani—a laila ka pōʻino. Windows 8. Ma Stable Diffusion, ʻo ka mana 1.5 i nānā ʻole ʻia i ka wā mua, kahi i hoʻomaikaʻi mālie ʻia e nā mea hoihoi, ua ukali ʻia e ka SD 2.0 i kūleʻa ʻole - ʻo ka ʻoiaʻiʻo, no ka mea, ua hoʻokomo pū ʻia ka encoder OpenCLIP, ʻaʻole maʻamau no nā hiʻohiʻona o kēia ʻano, aʻo ʻia ma nā kiʻi i koho ʻia mai wehe i ka waihona LAION-5B. I loko o kēia koho ʻana, ʻaʻole i hoʻopau wale ʻia nā kiʻi kiʻi kūpono ʻole (NSFW), akā ʻo nā kiʻi pena a me nā kiʻi hoʻi e nā mea pena kaulana e like me Greg Rutkowski kaulana. ʻO ia ka mea i hoʻonāukiuki loa i ka poʻe hoihoi: inā no ka SD 1.5, ʻoiai i ka mana kumu, me ka ʻole o ka hoʻohana ʻana i nā mākaʻikaʻi kiʻekiʻe loa, ua hana maikaʻi nā ʻōlelo aʻoaʻo maʻalahi me nā ʻano - "epic mediefal fantasy landscape, i ke ʻano o Greg Rutkowski" - a he mea kupanaha ka hopena, a laila ua ho'ōki ka SD 2.0 i ka "ʻike" i nā inoa o nā mea kiʻi kiʻi kaulana loa, nona nā kuleana kope i nā hana a lākou i hana ai a ʻaʻole i manaʻo e hoʻolako i kēia mau hana no ka hoʻomaʻamaʻa AI. Pono wau e hoʻohana i nā huaʻōlelo hou aʻe e wehewehe i kaʻu mea i makemake ai, a ʻaʻole maikaʻi ke kumu hoʻohālike me nā ʻōlelo hōʻailona lōʻihi loa.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

#Noho i lalo - kū i luna, noho i lalo - kū i luna

I ka hui pū ʻana me kahi encoder i hoʻololi ʻia (kahi mea hoʻololi i nā ʻōlelo aʻoaʻo i loko o nā hōʻailona kikohoʻe, a laila e hana pololei ai ke kumu hoʻohālike), ʻo ka hiki ʻole ke hoʻohana i nā ʻano inoa i hoʻonele wale ʻia nā mea hoihoi i ka hoʻoikaika ʻana i ka "ʻelua" iā lākou iho. ʻAe, ʻoiaʻiʻo: eia pono e noʻonoʻo i ka manawa like pehea e hoʻoponopono ai i ka ʻenehana i hōʻoia ʻia no ka haku ʻana i nā ʻōlelo aʻoaʻo no kahi encoder hou, a e hoʻomaʻamaʻa hoʻi i ke kumu hoʻohālike e ʻike i kēlā mau kiʻi a me nā kumuhana i hoʻolauna ʻole ʻia e nā mea hana ma ke kahua. o ka hoʻomaʻamaʻa mua - akā aia kahi ʻokoʻa kūpono mai nā kiʻi "hoʻokahi a me ka hapa" i hana ʻia e "ʻelua" ʻaʻole i hōʻoiaʻiʻo. ʻAe, mai ka SD 1.5 maʻamau ka nui o 512x512 pixels aia ka qualitative leap i 768x768, akā i kēlā manawa ke hoʻohana nei ke kaiāulu i nā upscalers, outpainters a me nā mea hana ʻē aʻe e hoʻonui i ka nui o ke kiʻi hope, no laila ua hala ʻo SD 2.0, a nui, ike ole ia. SDXL hoʻihoʻi i ka maʻamau (hoʻomohala ʻia e OpenAI a hoʻohana ʻia e ka papahana DALL-E) i ka CLIP encoder - ua wehe ʻia kona code, akā eia ka ʻikepili kahi i aʻo ʻia ai, ʻaʻole like me OpenCLIP, kuleana. Eia kekahi, ua hoʻonui ʻia ka nui canvas maʻamau no Oversize i 1024x1024, a ua ʻike ʻia kekahi mau mea hou aʻe, no laila ua hauʻoli ka poʻe hoihoi i kāna hoʻololi. A hiki i kēia lā, ʻo ia ka SDXL (a me kāna mau derivatives i ʻike ʻia ʻaʻole i lōʻihi ma mua, ʻaʻole i koi ʻia i ka hāmeʻa, e like me SDXL Turbo и Uila SDXL) hiki ke noʻonoʻo pono ʻia ʻo ia ka mea hoʻoheheʻe kiʻi AI open-source kaulana loa. Eia naʻe, hoʻopaʻapaʻa nā poʻe kākoʻo ikaika o SD 1.5 me kēia, e kuhikuhi ana i nā mea hana koʻikoʻi e like me ControlNet aia i SDXL ʻaʻole i hoʻoili pono ʻia.

A i kēia manawa, mai Iune 12, 2024, mai ka manawa o ka "hoʻokuʻu ʻana i loko o ka nahele" o ke code kumu hoʻohālike e ʻae ana i ka hanauna kūloko, ua hiki mai ka manawa no ka "open" version o SD 3 - ʻoi aku ka pololei, a laila Hoʻolahalaha Paʻa 3 Medium (SD3M a i ʻole SD3 2B) me 2 billion mau ʻāpana hana. Ma keʻano maʻamau, hoʻomanaʻo mākou ua pili kēia helu i ka huina o nā paona ma nā hoʻokomo o nā perceptrons āpau i ke kumu hoʻohālike. ʻOiai ma mua, i ʻApelila, ua hoʻāla ʻia ʻo Stability AI i ke ola a ua noi ʻia no ka hoʻohana pāʻoihana i ka 8 miliona (ma ke ʻano o ka helu o nā palena) Hoʻolahalaha Paʻa 3 Nui, aka SD3 8B. I mea hoʻomanaʻo, ua loaʻa iā SDXL 1.0 - 3,5 billion mau palena, akā naʻe, SD3M, e like me nā mea hoʻomohala, ʻo ia "ʻo ka hiʻohiʻona kiʻi kiʻi ʻoi loa a mākou i hana ai i kēia lā". Ua manaʻo ʻia me ka pono o ka hoʻomanaʻo wikiō liʻiliʻi ma mua o Oversized, pono ia e hana i nā kiʻi "me kahi pae kiʻekiʻe o ka photorealism" ʻoiai i ka pane ʻana i nā ʻōkuhi maʻalahi. Ma waena o nā mea maikaʻi o ka helu "C" ʻo ia hoʻi "ka maikaʻi ʻole o ka typography o nā kikokikona i loaʻa mai nā kiʻi i hana ʻia," "kahi ʻike hohonu o nā hōʻailona ma muli o ka hui pū ʻana o ʻekolu coders i ka manawa hoʻokahi," a " ka mākaukau no ka hoʻomaʻamaʻa ʻana i ka hoʻomaʻamaʻa hou aʻe ma nā pūʻulu ʻikepili i kaupalena ʻia.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

Ua manaʻo maopopo ʻia ʻo ke kaiāulu o ka poʻe hoihoi, ua loaʻa iā lākou kahi pāʻani hou i kali ʻia ma kā lākou makemake, e hoʻomaka e hoʻomanaʻo me ka ikaika like me ka "hoʻokahi a me ka hapa" a me ka "Oversize" i ko lākou manawa. Eia naʻe, ua hewa nā mea a pau mai ka hoʻomaka ʻana: SD3M i nā hola mua loa ma hope o ka hoʻolaha ʻana o nā faila hoʻohālike ma Hugging Face a me Civitai ua hiki ke hoohoka loa kou anaina, a elua i ka manawa hookahi. ʻO ka manawa mua - me kahi hiʻohiʻona idiosyncrasy i ka ʻike mua ʻole, me ka ʻōlelo like ʻole ʻole "e moe ana ma ka mauʻu"; ka lua - incredibly vague hua'ōlelo i loko o ka mea hoʻohana aelike, a hiki 'oihana loio i hiki ole ke hoomaopopo koke. A ʻoiai mai ka manaʻo o kahi mea hoihoi AI maʻamau ka mea i ʻike ʻole ʻia, ʻo ia ka ʻaoʻao kānāwai o ka hihia e hōʻike ʻia ma ke ala pololei loa i ka hoʻomohala hou ʻana o ke kumu hoʻohālike - a hiki ʻole ke hoʻomohala ʻia. hahai loa.

ʻO nā mea hana Stable Diffusion i wehe mua ʻia (ʻoi aku ka pololei, me nā waiwai hāmama o nā paona neural network i loaʻa no ka hoʻoiho manuahi a me ka hoʻokō ʻana ma ka ʻāina), e like me SDXL, ua hele pū ʻia me kekahi o nā hiʻohiʻona maʻamau. CreativeML Open RAIL++-M Laikini me nā hiʻohiʻona e like me "ka laikini mau loa, ka honua, ʻaʻole kūʻokoʻa, ʻaʻohe aliʻi, aliʻi ʻole, hiki ʻole ke hoʻihoʻi ʻia ke kope kope e hana hou, hoʻomākaukau, hōʻike i ka lehulehu, hoʻokō i ka lehulehu, sublicense a hāʻawi i nā mea ʻē aʻe o ke kumu hoʻohālike ponoʻī a me nā mea i loaʻa mai ia mea. " Hāʻawi ʻo "Troechka" i ʻelua ʻano laikini: no ka hoʻohana ʻole i ka ʻoihana - me ka ʻōlelo hoʻohaʻahaʻa loa e like me "Hāʻawi ʻo Stability AI iā ʻoe i kahi laikini kūʻokoʻa ʻole, honua, hiki ʻole ke hoʻololi ʻia, ʻaʻole sublicensable, revocable, aliʻi-free, laikini palena ʻole i ka waiwai naʻauao" - a ʻoi aku ka paʻakikī o ka pāʻoihana.

#ʻAʻole maikaʻi ka mauʻu

Ma hope o ka manawa pōkole loa, ua ʻae ke kaiāulu i kēlā ʻAʻole Open Source ʻo Stable Diffusion 3. A ʻo ka mea ʻoiaʻiʻo, ua haʻi ʻo ia i ka boycott o ka hui hoʻomohala, ʻaʻole makemake e hoʻopau i ka manawa a me ka hoʻoikaika ʻana i ka hoʻomaʻamaʻa hou ʻana o kahi kumu hoʻohālike i hoʻopaʻa ʻia a me ke kekee - me ka hoʻomaopopo ʻana e hiki ke Stability AI i kēlā me kēia manawa, i ka manawa liʻiliʻi o kāna media. nā luna, e lawe a hoʻopau i kahi laikini i hāʻawi mua ʻia i kahi mea hoihoi, e hana ana i kēlā aʻo hou. Hoʻokumu ʻia ka ʻaelike laikini ma ke ʻano e loaʻa ai i ka poʻe ʻaʻole loio e aʻo ana i ka manaʻo ma hope o ka hoʻopau ʻia ʻana o ka ʻae ʻana no ka hoʻohana pāʻoihana o SD3M, e koi ʻia kāna mea mua e wehe i nā derivatives i hana ʻia e ia mai ka waiwai naʻauao i laikini ʻia. iā ia, me nā hiʻohiʻona i hoʻomaʻamaʻa mua ʻia iā lākou iho (LoRA, ka hoʻohuli ʻana i nā kikokikona, nā helu kikoʻī holoʻokoʻa), a me kā lākou derivatives ('ōlelo: "I ka pau ʻana o kēia ʻaelike, e holoi ʻoe a hoʻōki i ka hoʻohana ʻana i nā huahana lako polokalamu a i ʻole nā ​​​​hana derivative") - kēlā ʻo ia nā hua o ka hana a nā poʻe ʻē aʻe i hoʻohana i kēia mau hiʻohiʻona derivative i wahi hoʻomaka no kāu hana ponoʻī; Eia kekahi, ʻaʻole i uku ʻia e kekahi a ua hoʻokō ʻia me ka hoihoi maʻemaʻe.

Ma hope koke iho o ka piʻi ʻana o ka inaina no kēia pilikia, ua hoʻomaka nā ʻōlelo mai nā loio ʻoihana, ʻaʻole ia he ʻino a ʻo ka hoʻomanaʻo ʻana me ka pāpā ʻana i ka hoʻohana hou ʻana e pili wale i kekahi mau huahana kōkua paʻa i hoʻololi ʻia ʻo Stability AI i kahi mea hoʻohana pāʻoihana (e ʻōlelo, e wikiwiki a hoʻonui i ka SD3M hoʻomaʻamaʻa like) - akā ʻo ka hui ponoʻī. ʻaʻole naʻe i hāʻawi i nā wehewehe hope loa no kēia mea a ʻaʻole i hāʻawi. A ʻo ka ʻoiaʻiʻo maoli o ka noho ʻana i nā pule ʻekolu i hala iho nei (i ka manawa e kākau ai i kēia ʻatikala) mai ka ʻike ʻia ʻana o ka "C" i ka lehulehu ākea e hōʻino i ka inoa o ka mea hoʻomohala i ʻoi aku ka nui ma mua o ka hoʻopōʻino ʻana o ka mauʻu i nā kaikamahine. hana ʻia e kāna hana ʻana.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

No ka mea kanu kaulana, i lilo i meme maoli i loko o nā hola mua ma ka Hugging Face, a laila ma kahi kokoke i nā pūnaewele kūikawā a i ʻole ka liʻiliʻi ma ka Pūnaewele, ua ʻike ʻia ʻo ka hele ʻana o ka huaʻōlelo e like me "ke kaikamahine e moe ana ma ka mauʻu" e alakaʻi i ka ʻike ʻia i nā hopena "C" ʻaʻole wale nā ​​hallucinations. , akā, nā hana pōʻino o ka mea maʻi - i loko o ka manaʻo lapaʻau - nā manaʻo o nā mea pena kiʻi a me nā mea hana kiʻiʻoniʻoni kūikawā i ka weliweli kino (ke noi aku nei mākou iā ʻoe, inā aloha kou noʻonoʻo a me kou ola, e haʻalele i kēia a ʻaʻole hoʻi e hoʻāʻo. e paʻi i kēia huaʻōlelo i loko o ka puka aniani ʻimi kiʻi me ka hoʻopaʻa ʻana i ka kānana palekana). I ka manawa like, nā kiʻi o ke kū - a, i ka liʻiliʻi liʻiliʻi, e noho ana - loaʻa nā kānaka i kahi papa C me ka hilinaʻi B hoʻohui, a ʻo nā kiʻi i kekahi manawa e puka me ka hala ʻole; ʻaʻole i ʻoi aku ka hewa ma mua o ke kumu hoʻohālike SDXL 1.0 - ʻo ka hopu ma aneʻi he ʻano kapu kūloko ma ke kūlana pae o ke kino kanaka.

Ke hoʻoholo nei e ka ʻōlelo a Emad Mostaque, ka mea nāna i hoʻokumu a i mua (a hiki i Malaki 2024) ke poʻo o Stability AI, nāna i haʻalele i ka hui "E komo i nā papahana decentralized ma ke kahua o ka naʻauao artificial", ka hoʻomāinoino nui i ka SD3M ma mua pono o ka wehe ʻia ʻana o kāna mau unahi no ka hoʻohana palena ʻole ʻana i ka ʻoihana (API o ke kumu hoʻohālike SD3 8B nui no ka hanauna pūnaewele, e hoʻomanaʻo. loaʻa ma nā pūnaewele hoa mai ʻApelila, akā hūnā ʻia kona mau paona) he hopena ia o ka makemake o ke alakaʻi i kēia manawa no ka palekana - "ma muli o nā kuleana hoʻoponopono", i hoʻokumu ʻia i loko o Malaki o kēia makahiki e like me Kaulike Aʻo hoʻohanaʻia. Aia ma lalo o kēia kulekele, me ka hoʻohana ʻana i ka SD3M generative model, ʻaʻole ʻae ʻia nā mea hoʻohana e "hoʻokō, hoʻolaha, hoʻolaha, hoʻoikaika, paipai, hoʻolālā, hoʻoulu a hoʻoikaika hou i ka hana ʻino, hoʻoweliweli a i ʻole ka hana ʻana i nā mea inaina e hoʻowahāwahā a hoʻoweliweli paha i kahi. ka pūʻulu o ka poʻe i mālama ʻia (inā paha ma muli o ke kāne, ka lāhui, ka ʻike wahine a i ʻole ke ʻano, ka hoʻomana, a me nā mea ʻē aʻe)," no laila ʻaʻohe kiʻi o nā pandas i ka mea a ko lākou makuahine i hānau ai i ka hakakā ʻana i nā ʻīlio hihiu! ʻO nā pōpoki i loko o nā pāpale ʻakaʻaka, nā ʻīlio i nā ʻaʻahu nani, nā ʻōmole me nā mea ʻike ʻole a me nā kuki hou pololei mai ka umu!

ʻO ka ʻōlelo ʻenehana, ʻo ka emasculation paha o ke kumu hoʻohālike i loko o ka ʻoiaʻiʻo ʻo nā kiʻi me nā poʻe wahaheʻe a me nā kiʻi ʻē aʻe i hōʻike ʻia i kahi wehewehe ʻino i hoʻokaʻawale ʻia mai ka hoʻonohonoho ʻikepili hoʻomaʻamaʻa - a no laila i kēia manawa "ʻaʻole maopopo" ka "C" i ka. ke ano o ka huaolelo " wahahee". A i ʻole ka hoʻolālā SD3 hou i hiki ke ʻike me ka hilinaʻi i nā paona ma nā perceptrons i hoʻāla ʻia i ka wā o ka hana ʻana o nā kiʻi "palekana" - a ua koho ʻia kēia mau kaupaona i ka ʻole ma mua o ka hoʻokuʻu ʻana, ʻo ka hopena ʻaoʻao ʻo ia ka "forced hallucination." Malia paha, Hiki ke hoʻohālikelike ʻia kēia me kahi lobotomy: unuhi pololei ka encoder i ka kikokikona i loko o nā hōʻailona, ​​akā i loko o ka "palekana" wahi huna, ʻaʻole hōʻike hou kēia mau hōʻailona i kekahi mea kikoʻī, a no laila ua loaʻa nā pika i ke kiʻi ma ke ʻano maʻamau.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

Ke noʻonoʻo nei i ka loaʻa ʻana o ka API o ka hiʻohiʻona SD3 8B piha, akā pani ʻia no kekahi mau mahina i kēia manawa a me nā hōʻoia ikaika o nā mana media Stability AI e "compactified" 2B ʻaneʻane like ka maikaʻi o ka ʻike kikokikona a me ka hana kiʻi, Ua hoʻokipa ka poʻe hoihoi kiʻi kiʻi AI i ka hoʻokuʻu ʻia ʻana o nā unahi SD3M i ka lehulehu ma Iune 12 me ka ʻoi aku o ka hoihoi: i nā hola 24 mua i hoʻoiho ʻia ke kumu hoʻohālike 2,7 miliona mau manawa. I kēia manawa, hiki nō ke kiʻi iā ia, ʻoiai ma kahi ala ʻoi aku ka pōʻai ma mua o ka mea maʻamau no nā SDXL a me SD 1.5 checkpoints. ʻOiaʻiʻo, ʻo ke ala maʻamau ka hele ʻana i ka pūnaewele Civitai, kahi i hoʻoiho ʻia ai ka hapa nui o nā hiʻohiʻona me ka ʻole o ka hoʻopaʻa inoa ʻana, akā mai Iune 17 a hiki i ka hoʻololi ʻana o kēia ʻatikala no ka hoʻolālā, kahi ʻaoʻao o kēia pūnaewele i hoʻolaʻa ʻia i ka "C" aia i ka auau auau. Hoʻokahi wale nō kumu: ua kākau ʻia ka laikini pāʻoihana no SD3M ma ka ʻōlelo maopopo ʻole a ua hoʻomaha nā loio o Civitai e aʻo pono iā ia. Ma hope o nā mea a pau, inā hoʻomaʻamaʻa kekahi poʻe hoihoi iā LoRA no kahi "C" ma kāna PC a kau iā ia ma Civitai, a hoʻoholo koke ʻo Stability AI he kūpono ʻole ka hopena a hoʻopau i ka laikini o ka mea hewa, he aha ka mea e hana ai ka pūnaewele hoʻokipa i kēia hihia? Ma hope o nā mea a pau, ʻaʻole wale ia e hoʻokipa i nā mākaʻikaʻi, nā cyclograms kōkua a me nā hiʻohiʻona, akā hāʻawi pū i nā malihini i ka manawa e hana ai i nā kiʻi i hoʻokumu ʻia i ke ao a hoʻomaʻamaʻa i ka LoRA like, nā hoʻololi kikokikona, etc. Ma keʻano laulā, ʻoiai ke holomua nei ka hoʻokolokolo, hiki iā ʻoe ke lawe wale i nā faila o ke kumu hoʻohālike ponoʻī a me nā mea hoʻololi kikokikona-to-token ʻekolu e hele pū me ia. mai ka ʻaoʻao ponoʻī o Stability AI ma ka puka makani Hugging Face.

#E hoʻomaka kākou

ʻOiaʻiʻo, aia kahi nuance: i mea e komo ai i nā loulou download, pono ʻoe e komo i ka pūnaewele, a laila e hōʻoia i kou ʻae ʻana i ka palapala laikini draconian i ʻōlelo ʻia ma mua iki - akā naʻe, manuahi kēia kaʻina hana a hiki ke loaʻa mai Russia. . ʻO ka huina, ʻehā mau koho no nā hiʻohiʻona maoli (nā hiʻohiʻona) a me ʻehā - nā mea hoʻololi i nā ʻōkuhi kikokikona i nā hōʻailona (encoders), a me ʻekolu cyclograms kuhikuhi no ka hoʻokō ʻana i ka hana hana ComfyUI, a mākou i kamaʻilio mua ai:

nā kumu hoʻohālike:

  • sd3_medium.safetensors
  • sd3_medium_incl_clips.safetensors
  • sd3_medium_incl_clips_t5xxlfp8.safetensors
  • sd3_medium_incl_clips_t5xxlfp16.safetensors

nā mea hoʻopili:

  • clip_g.safetensors
  • clip_l.safetensors
  • t5xxl_fp8_e4m3fn.safetensors
  • t5xxl_fp16.safetensors

cyclograms:

  • sd3_medium_example_workflow_basic.json
  • sd3_medium_example_workflow_multi_prompt.json
  • sd3_medium_example_workflow_upscaling.json

Ma kēia "Workshop" e kaupalena mākou iā mākou iho i ke kumu hoʻohālike sd3_medium.safetensors (4,2 GB), ʻekolu encoders - clip_g.safetensors (1,3 GB), clip_l.safetensors (234 MB) a me t5xxl_fp8_e4m3fn.safetensors (4,7 GB) . e like me ka cyclogram sd3_medium_example_workflow_multi_prompt.json. ʻO ka ʻoiaʻiʻo ʻo kā mākou mīkini hoʻāʻo, e hoʻomanaʻo mākou iā ʻoe, kahi kāleka wikiō GeForce GTX 1070 me 8 GB o ka wikiō RAM, a ʻo nā hiʻohiʻona nui me nā mea hoʻololi i hoʻohui ʻia i ka manawa hoʻokahi ʻaʻole kūpono i kēia leo. No nā helu helu e pili ana i ka SD 1.5 a me SDXL, ua kūkulu ʻia nā encoders i loko o ka faila nui ma ke ʻano maʻamau, akā i kēia hihia ʻaʻole ʻelua o kēia mau mea hoʻololi, akā ʻekolu, no ka huina o 6 GB - me ke kumu hoʻohālike ponoʻī. aia ma mua o 10 GB; a inā ʻoe e lawe i ka mana 16-bit o ka encoder T5XXL, pono ʻoe i kahi kāleka wikiō koʻikoʻi. Ma ka mana kahi e hoʻokomo mua ʻia ai nā mea hoʻololi kikokikona i ka hoʻomanaʻo wikiō, a laila hoʻouka ʻia kahi kumu hoʻohālike e hana ana me kēia mau hōʻailona, ​​ʻo kahi mea hoʻololi kiʻi 6 GB e hana maikaʻi. Mai kēia manaʻo, ʻoi aku ka maikaʻi o ka "troika" modular i kahi kikoʻī 5-7 GB SDXL maʻamau.

ʻO SD3M kahi kumu hoʻohālike e pili ana i nā mea hoʻololi diffusion multimodal (Mea hoʻololi Multimodal Diffusion, MMDiT) - a no laila ʻokoʻa ʻokoʻa mai nā hoʻomohala mua o Stability AI (a ʻaʻole wale ia), i hoʻokumu ʻia ma ʻO ka hoʻolālā U-Net, i manaʻo ʻia i ka makahiki 2015 ʻAʻole ʻo ka Workshop kahi no ka ʻimi hohonu ʻana i nā ʻokoʻa ma waena o kēia mau ala i ka hana kiʻi AI; e ʻōlelo wale kākou Hāʻawi ʻo MMDiT i ka hana hoʻohālike i hoʻomaikaʻi ʻia, kona hiki ke hana me ka heluna nui o na tokens (no ka mea, e hiki ai i ka mea hoohana ke hoopuka i na kaha kikokikona nui loa, a me ka pūnaewele e hahai ia lakou me ka hikiwawe loa), a me ka maikai o na kii i loaa mai. Hiki i ka SD3 8B piha piha ke hana i nā kiʻi ma kahi canvas 4 MP (2048 × 2048 pixels), a me ma mua o DALL-E 3, Midjourney v6 a me Ideogram v1 i nā hoʻāʻo e like me ka hana hou ʻana o ke kikokikona i loko o ke kiʻi, ka pololei o ka hoʻohālikelike ʻana i ke kiʻi i loaʻa mai me kahi ʻike kikokikona, a me ka nani o nā hiʻohiʻona. Hoʻololi ʻia ka hoʻololi ʻana o ka kikokikona i kahi vector o nā hōʻailona e hana ʻia e ʻekolu encoder i ka manawa hoʻokahi (ʻelua mau hiʻohiʻona CLIP a hoʻokahi T5-XXL - "T5", ma ke ala, mai Mea hoʻololi kikokikona i ka kikokikona) - a, ma ka ʻōlelo maʻamau, ʻaʻole pono lākou e hana me ka hōʻailona like.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

Akā, lawa nā ʻōlelo mua: e iho kākou i ka mea i hoʻolaʻa ʻia ai ka "Workshop" i ka hana ʻana i nā kiʻi e pili ana i ke kumu hoʻohālike SD3M. No kēia mea mākou e hoʻohana ai, e like me ka mea i ʻōlelo mua ʻia, ka ʻenehana hana ComfyUI, hiki iā ʻoe ke hoʻoiho ma o ka loulou pololei mai GitHub. Hoʻomaopopo mākou i kēia koho no ka hoʻokō ʻana i nā mea hoʻololi kiʻi NVIDIA a i ʻole pololei ma kahi AMD a i ʻole Intel CPU (ʻo ia hoʻi, e ʻoi aku ka lohi): nā mea nona nā kāleka wikiō AMD. Hāʻawi ʻia ke koʻokoʻo ma ke ʻano o nā pūʻolo rocm a me pytorch, hiki ke hoʻokomo ʻia ma o ka luna hoʻoiho pip.

I ka pau ʻana o ka hoʻokomo ʻana i ka wahi hana, pono ʻoe e kau i nā faila .safetensors i hoʻoiho mua ʻia: nā hiʻohiʻona - ma ka papa kuhikuhi ComfyUImodelscheckpoints, kikokikona i nā mea hoʻololi hōʻailona - ma ComfyUImodelsclip. A - hiki iā ʻoe ke hoʻomaka!

#ʻO ka manawa e wikiwiki ai

Pono e haʻi ʻia ʻo AUTOMATIC1111, kahi wahi hana i ʻike ʻia e ka poʻe heluhelu o nā "Workshops" mua ma ke kumuhana o ke kiʻi AI, ma ka hopena o Iune. Loaʻa ka manawa e hana ai i ka SD3M, akā naʻe, ma ComfyUI, ʻo ke kākoʻo no ke kumu hoʻohālike hou e mau nei ka piha loa. ʻAʻole ia he mea kupanaha - ma hope o nā mea a pau, a hiki i kēia manawa, ka mea kākau o ka "pasta monster", i ʻike ʻia e ke kaiāulu o nā mea hoihoi ma lalo o ka inoa inoa ʻo ComfyAnonimous, a i ʻole Comfy, he limahana o Stability AI, kahi āna i hana ai, ʻo ia hoʻi, ma ke kaiapuni hana ʻoihana kūloko i hoʻohana ʻia e nā mea hoʻomohala ponoʻī. E like me kā mākou e ʻike ai ma hope aʻe, hōʻike maoli ka mana hou o ComfyUI i ka loaʻa ʻana o kekahi mau ʻike mai kāna mea kākau e pili ana i ke ʻano o ka hana ʻana a me ka hana ʻana o kēia kumu hoʻopaʻapaʻa - nā ʻike i hana ʻia e nā mea hana o nā wahi hana ʻē aʻe no ka hoʻokō kūloko o Stable Diffusion 3 Medium hiki iā lākou ke haʻaheo no nā kumu hiki ʻole iā lākou.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

E hoʻouka iā ComfyUI ma ka mana lawe lima ma lalo o Windows He maʻalahi e like me ka pai: ma hope o ka hoʻoiho ʻana i ka waihona ZIP pili mai ka ʻaoʻao papahana kūhelu wehe wale ia i loko o kekahi papa kuhikuhi kūpono; makemake ʻia, ʻoiaʻiʻo, ma kahi ʻāpana logical e pili ana i kahi SSD, ʻaʻole ma kahi HDD - hoʻololi ma waena o ka drive a me ka hoʻomanaʻo, me ka noʻonoʻo ʻana i ka hoʻouka ʻana a me ka wehe ʻana i nā pōʻai o nā hiʻohiʻona, ʻoiai e hana i kahi kiʻi hoʻokahi (ke kaiapuni. Pono mua e kau i nā mea hoʻololi kikokikona i ka RAM wikiō, a laila e hoʻomaʻemaʻe i ka hoʻomanaʻo wikiō a hoʻouka i ka SD3M ponoʻī) i manaʻo ʻia e ʻoi aku ka nui, ʻo ka liʻiliʻi o ka hoʻomanaʻo wikiō i loaʻa i kahi kamepiula i hāʻawi ʻia. Ma ke ala, ʻoi aku ka maikaʻi o kahi hoʻonohonoho portable ma muli o kona kūʻokoʻa holoʻokoʻa: ʻaʻohe mea - koe wale no ka nui o ka hakahaka ma ka disk logical - pale iā ʻoe mai ka lawe ʻana i nā kope o ComfyUI e like me kou makemake e hoʻāʻo i kou puʻuwai. ʻoluʻolu me nā mea hoʻonui like ʻole, me ka makaʻu ʻole i ka hōʻino ʻana i kahi ʻōnaehana i hoʻopau ʻia a hana maikaʻi loa.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

Ma hope o ka hōʻoia ʻana ua waiho ʻia ka faila kumu hoʻohālike SD3M nui me ka ʻole o nā encoders hōʻailona kikokikona i kūkulu ʻia (faila stableDiffusion3SD3_sd3Medium.safetensors, 4,2 GB) i loko o ka papa kuhikuhi checkpoints (i ka hihia o kā mākou hoʻonohonoho hoʻāʻo, ʻo ke ala piha ʻo C:\Fun-n-Games\ComfyUI\SD3\ComfyUImodels\checkpoints), a ʻo nā hiʻohiʻona encoder ʻekolu (stableDiffusion3SD3_textEncoderClipG.safetensors, stableDiffusion3SD3_textEncoderClipL.safetensors, a me nā faila stableDiffusion3SD3_textEncoderT5E4m3fn.safetensors; 1,3 GB, 234 MB, a me 4,7 GB, kēlā me kēia) i loko o ka papa kuhikuhi clip (C:\Fun-n-Games\ComfyUI\SD3\ComfyUImodelsclip), hiki iā ʻoe ke hoʻomaka i ke kaiapuni hana ma ke kaomi pālua ʻana i ka faila. run_nvidia_gpu.bat i loko o ka waihona kumu (i kā mākou hihia, C:\Fun-n-Games\ComfyUI\SD3). Ma hope o ka hoʻomaka ʻana o ke kikowaena, ma ka puka makani kauoha e ʻike ʻia Windows e wehe ʻakomi ʻia kahi pā hou ma kāu polokalamu kele pūnaewele paʻamau (ʻo kēia ka mea i hōʻike ʻia e nā hoʻonohonoho faila BAT), kahi e hiki ai ke komo i ka pūnaewele ma 127.0.0.1/8188 hana ʻia e mākou ma mua (ʻoiai inā he hoʻohālikelike mua wale nō) "pasta monster".

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

I ka manaʻo, inā loaʻa iā ʻoe kahi kāleka wikiō NVIDIA hou aʻe i kāu makemake (hanau RTX, ʻaʻole GTX, ʻoiai me 6 GB wale nō o ka wikiō RAM), hiki iā ʻoe ke hoʻouka koke i loko o ka wahi hana i ka cyclogram kuhikuhi i kākau ʻia e ComfyAnonimous iā ia iho, ʻo ia. i ʻōlelo ʻia ma mua - faila comfy_example_workflows_sd3_medium_example_workflow_multi_prompt.json me nā puka makani he nui no ke komo ʻana i nā koi, hoʻokahi no kēlā me kēia o nā encoders ʻekolu, a hana pū me ia. ʻOiaʻiʻo, pono ʻoe e lawe i nā inoa ʻehā o nā faila kumu hoʻohālike (i kā lākou hoʻouka ʻana i nā nodes) i ka laina me nā mea i loaʻa. Hoʻohana ʻia ka mea kākau o ka cyclogram reference ma kāna wahi hana (ma Stability AI, e like me ka mea i ʻōlelo ʻia) me nā faila i loaʻa i ka wahi i kapa ʻia he ʻokoʻa iki, no laila inā ʻoe e kaomi i ke pihi "Queue Prompt" i ka spartan ComfyUI interface ma hope koke o ka hoʻouka ʻana i ka cyclogram, ʻO ka hana ʻana i ke kaiapuni e hoʻopuka i kahi memo hewa.

#ʻEkolu kahua no ka hanauna AI

Eia naʻe, ʻaʻole paʻakikī kēia e hoʻoponopono: ʻo ka mea i ʻoi aku ke kaumaha ʻo ka ʻoiaʻiʻo ʻo ka GTX 1070 i hoʻomaʻamaʻa ʻia i kā mākou makemake he lohi nui i ka hoʻoili ʻana i ka SD3M - ke kiʻi kiʻi kiʻi i ka wikiwiki o 27-30 kekona no kēlā me kēia hoʻololi, a, inā. Manaʻo ʻoe ua hoʻonohonoho ʻia ka "Steps" i ka cyclogram reference i "28", kahi manawa lōʻihi ʻole. No laila, e hana mākou i kahi hoʻonui liʻiliʻi - e hoʻohana mākou i ka Python module venv (nā wahi uila, “virtual environments”), i hoʻolālā ʻia, i mea e wikiwiki ai ka hana o nā hiʻohiʻona AI generative. ʻAʻole i hoʻokomo ʻia i loko o ka pūʻolo o ka lawe ʻana i ka mana lawe lima o ComfyUI, akā, nui nā ala e hoʻokomo ai, ka mea hope e hoʻolapalapa i lalo i ka lawe ʻana i kahi kaiapuni Python piha ma kahi PC kūloko - a hoʻāla i ka module pono mai kēia kaiapuni.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

E manaʻo mākou i ka ʻoiaʻiʻo o ka poʻe heluhelu e hahai ana i kā mākou "Workshops" ua loaʻa i kahi hoʻonohonoho hana ikaika o AUTOMATIC1111 ma kā lākou mau mīkini. I kēia hihia, ʻoi aku ka maʻalahi o nā mea āpau: ua hoʻonohonoho ʻia ka module venv ma laila, a ʻo nā mea āpau e pono ai ke hana e hoʻāla ai i ka wā e hoʻomaka ai i ka ʻenehana hana ComfyUI. e hana pono i ke kelepona. ʻO ka mea mua, pono ʻoe e pani i ka kikowaena ma ka hoʻololi ʻana i kona puka aniani a kaomi "Ctrl" + "C", a laila e komo i ka "y" e hōʻoia; Ma hope o kēlā, e kope i ka faila BAT run_nvidia_gpu.bat i kahi hou, me ka inoa, no ka laʻana, run_with_venv.bat. He maʻalahi loa ka faila hoʻomaka mua - kāhea wale ia i kahi kope i lawe ʻia o Python me ke koho --windows-standalone-build:

.python_embededpython.exe -s ComfyUImain.py --windows-standalone-build

e kakali

ʻAʻole maopopo loa kēia ʻāpana iā ia iho - ʻo ia ka manaʻo o kekahi mau optimizations, ʻo ia paha, i hoʻolālā ʻia no nā mea hoʻololi kiʻi NVIDIA hou aʻe a no laila hiki ke hoʻonui i ke ola o ka poʻe e hoʻomau mau nei i kā lākou GTX pono. No kēia kumu, e wehe mākou i -windows-standalone-build mai ka laina kauoha, a i ka manawa like e haʻalele mākou i kahi hoʻolālā hou hou - ʻo ka "smart memory manager" paʻamau, ka hoʻomanaʻo akamai. ho'āʻo e paʻa i ka ʻike e like me ka hiki i ka RAM wikiōme ka wehe ole ana. ʻO kēia ka wikiwiki o ke kaha kiʻi o AI, akā i ka manawa like e hoʻohuli ai i kā mākou kamepiula kahiko i kahi ʻōnaehana hana hoʻokahi - ʻaʻole hiki ke heenalu i ka pūnaewele, pāʻani pāʻani, a i ʻole hana pū me nā palapala a me nā leka uila ma ka PC. e like me ka hana o ke kaiapuni hana. No laila no ka poʻe ʻaʻohe kamepiula i hoʻolaʻa ʻia no AI arts, ʻo ka faila BAT maikaʻi loa no ka hoʻokuʻu ʻana iā ComfyUI ʻoi aku ka maikaʻi (ʻaʻole wale no ke kumu o ka hana ʻana i nā kiʻi mai SD3M, ma ke ala, kūpono no SDXL):

@echo haʻalele

kelepona cd C:Fun-n-GamesGitstable-diffusion-webuivenvScripts

echo %cd%

kāhea activate.bat

echo venv ho'ā

e kāhea i ka cd C:Fun-n-GamesComfyUI-SD3

echo %cd%

kāhea iā .python_embededpython.exe -s ComfyUImain.py --disable-smart-memory

e kakali

Maanei ua manaʻo ʻia ua lawe ʻia ka hoʻokomo ʻana o ComfyUI ma ka papa kuhikuhi C: Fun-n-GamesComfyUI-SD3, a ua hoʻokomo mua ʻia ʻo AUTOMATIC1111 ma C: Fun-n-GamesGitstable-diffusion-webui. Pono nā "echoes" he nui wale no ka nānā ʻana i ka hoʻololi ʻana o nā papa kuhikuhi e holo maʻamau a ke hoʻokō ʻia nei nā kauoha e pono ai - ma hope o ka pau ʻana o nā mea āpau, hiki ke wehe ʻia mai ka faila BAT.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

E hoʻokuʻu hou i ka papa hana, i kēia manawa ma ke kaomi pālua run_with_venv.bat. No ka mea ua pani wale mākou i ke kikowaena a ʻaʻole i hoʻopā i ka ʻaoʻao pūnaewele, ʻo ka cyclogram kuhikuhi ComfyUI like me nā inoa hoʻohālike i hoʻoponopono ʻia e noho mau i ka ʻaoʻao pili. E nānā pono kākou i kona ʻaoʻao ʻākau: aia ma laila ka "Preview Image", ʻaʻole ia e mālama i ke kiʻi i hoʻopau ʻia i ka disk, akā hōʻike wale ia. Inā holo ʻoe i ka cyclogram i kēlā me kēia manawa e hoʻohua i hoʻokahi kiʻi, e loiloi iā ia me ka ʻike maka, e hoʻololi i kekahi mea i loko o nā ʻāpana, a holo hou - he koho hana holoʻokoʻa kēia: hiki ke mālama ʻia ke kiʻi āu e makemake ai ma ke kaomi ʻana. . Akā inā hoʻokō ʻoe i nā hanauna he nui ma ke ʻano hana, ʻoi aku ka maikaʻi o ka hōʻiliʻili ʻana o kā lākou hopena i ka hoʻomanaʻo mau loa (ma ka papa kuhikuhi ComfyUIoutput ma ka paʻamau).

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

No laila ʻoi aku ka maikaʻi o ka hoʻololi koke ʻana i ka node "Preview Image" i "Save Image". No ka hana ʻana i kēia, kaomi pālua me ka pihi ʻiole hema ma kekahi ʻāpana manuahi o ka cyclogram - e wehe ʻia kahi puka koho node me kahi pahu huli. Ma kēia laina, e hoʻomaka e paʻi "Save ..." - a kokoke koke mākou e ʻike i ka inoa āu e ʻimi nei. A laila ʻo nā mea a pau āu e hana ai, ʻo ia ke kaomi a hoʻohui i ka hoʻokomo o ka node i ʻike ʻia i ka puka "IMAGE" o ka node "VAE Decode", kahi i hoʻopili mua ʻia ai ka "Preview Image". Hiki ke wehe hou ʻia ka "Preview Image" - e koho wale iā ia ma ke kaomi ʻana i ke poʻo inoa a kaomi i ke kī "Del" ma ka papa keyboard.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

A ʻo kēia ka manawa e hoʻomaka ai i ka cyclogram reference i kākau ʻia e ComfyAnonimous (me kā mākou hoʻoponopono haʻahaʻa) no ka hoʻokō. ʻIke ʻia kēia:

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

ʻO kahi kiʻi hoihoi loa, me ke ʻano o ke ʻano - a ʻaʻole hiki iā ʻoe ke haʻi aku ua hana ʻia me ka hoʻohana ʻana i ke kumu hoʻohālike i hoʻopau ʻia e nā ʻōlelo kuhikuhi no ke kiʻi ʻana i ka poʻe e moe ana ma ka mauʻu. I ka manawa like, hana wikiwiki ka ʻōnaehana - ma kahi o 5-6 s i kēlā me kēia ʻike no kahi kiʻi 1 megapixel ma ka GTX 1070 hiki ke manaʻo ʻia he hōʻailona kūpono. No ka hoʻohālikelike: ʻo ka PC like ma ka ComfyUI like me ka faila BAT hoʻokahi e hoʻohua i nā kiʻi SDXL o nā nui like, e hoʻolimalima ana ma kahi o 6-7 kekona i kēlā me kēia hoʻololi, no laila hiki ke noʻonoʻo ʻia ka "C" ʻoi aku ka liʻiliʻi o ka koi ʻana i ka lako PC kahi e hana ai AI. ke holo nei.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

I kēia manawa, e hoʻoponopono kākou i ka nui o ka canvas. ʻAʻole mamao loa mai ka "EmptySD3LatentImage" node, kahi e hoʻonoho ai iā lākou, aia kahi "idle" (ma ke ʻano o ka pili ʻole ʻana i kekahi mea ma kekahi ʻaoʻao) node kuhikuhi "Note", aia kahi hoʻomanaʻo nui: ka huina o ka ʻO ke kiʻi i ka hihia o SD3M pono e like me 1 MPix, - ma muli o ia e koho ai ʻoe i nā ana o nā ʻaoʻao o kahi kāwele rectangular. E hoʻonoho iā lākou a laila ʻo 1344 × 768 - ma kahi o 1,03 megapixels e puka mai.

E ʻoluʻolu: ma luna ka "Seed" node, kahi i hōʻike ʻia ai ka hua ponoʻī, ma kēia hihia "945512652412924", a ua hōʻike ʻia ʻaʻole pono ia e loli ma hope o ka hanauna (ka "paʻa" parameter).

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

E hoʻokō i ka cyclogram like me ka hua hoʻokahi, akā no ka canvas rectangular. ʻIke koke ʻia ʻo ka liʻiliʻi o ka manawa hoʻokō holoʻokoʻa, ʻoiai e mau ana ka wikiwiki o ka hāʻawi ʻana - ʻoi aku ma mua o 6 kekona no kēlā me kēia ʻike. A kūpono kēia: no ka mea ʻaʻole i loli nā ʻōlelo aʻoaʻo, ʻaʻohe pono e hoʻouka hou i ka encoder (s) no lākou. ʻO ke kiʻi i loaʻa, ʻoiaʻiʻo, ʻokoʻa ʻē aʻe mai ka mea mua, square one, akā ʻaʻole ma ke kumu - ua mālama ʻia ke ʻano holoʻokoʻa, e like me ka mea e manaʻo ai.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

I kēia manawa, e nānā kākou i nā "CLIPTextEncodeSD3" a me "CLIP Text Encode (Negative Prompt)" nodes. Kū ka mea mua no ka mea aia ʻekolu mau kahua hoʻokomo i ka manawa hoʻokahi; inā ʻoe e wehe i ka kikokikona mai iā lākou, e ʻike ʻia nā māka no nā encoders i manaʻo ʻia - mai luna a lalo ʻo CLIP G, CLIP L a me T5XXL. Ma mua, ʻaʻohe ʻano nodes i ComfyUI no nā kumu maopopo. Aia i loko o ka cyclogram kuhikuhi nā ʻōlelo kuhikuhi pōkole ʻelua no nā kahua kikokikona mua ʻelua (no nā mea hoʻololi CLIP G a me CLIP L) a ʻoi aku ka laulā no ke kolu - T5XXL. He mea maopopo e hiki ke pāʻani ʻia nā mea o kēia mau kahua i loko o nā palena ākea, a ʻo ke aʻo ʻana i ka nui o ka hoʻololi ʻana i ke kikokikona i loko o ia mau mea e pili ana i ke kiʻi hope he hana ʻole, akā hoihoi loa. Eia nō naʻe, no nā kumu e akaka iki ma hope aku, ʻaʻole mākou e hoʻoponopono pono i kēia manawa.

Akā ma ka "CLIP Text Encode (Negative Prompt)" node, ma kahi ʻē, ʻaʻohe mea kūikawā, akā mahalo i ka paʻakikī o ke ala mai ia mea i ka hoʻokomo "conditioning" pili o ka node "KSampler" nui! ʻO kēia ala bifurcates, a ʻo kekahi o kāna mau lālā (ʻo ka mea ma luna o kēia hihia) e hōʻike ana e hoʻomaka ana mai ka 10% o nā ʻanuʻu hanauna a hiki i kona hoʻopau ʻana, ʻaʻole e noʻonoʻo ka ʻōnaehana i ka hint maikaʻi ʻole (e hele ana i ke ala ma o ka ʻO ka node "ConditioningZeroOut" ʻo ia hoʻi ke ʻano o ka zeroing kūlana). ʻOiai ʻo ka lālā ʻelua e hāʻawi i ka hōʻailona maikaʻi ʻole (me ke kūlana me ka hapalua o ke kaumaha) i ka hana hou ʻana me ka ʻole o nā loli - akā ma ka 10% mua wale nō o ka huina o nā ʻanuʻu hanauna.

#Noe mamao

Eia hou: ʻo ka 10% mua, ʻo ia hoʻi 3 o 28 mau ʻanuʻu hanauna i hāʻawi ʻia i kēia hihia, ua hoʻouna ʻia kahi hōʻailona maikaʻi ʻole i ka node "KSampler", kahi e hana nei i kahi kiʻi ma kahi huna huna (i loko o ka pixel space, i.e. i loko o ke kanaka. -ke kiʻi hoʻomaopopo, unuhi ʻia ka hopena o kāna hoʻopuka e ka node aʻe, "VAE Decoder"), ma ke ʻano maʻamau: ʻaʻole hana ka lālā o luna (me ka hoʻoponopono hou ʻana), ʻo ka mea haʻahaʻa wale nō e hana. No ke koena o 90% o nā ʻanuʻu (25 o 28 i kā mākou hihia), ʻaʻole hana ka ʻōlelo maikaʻi ʻole: ʻoi aku ka ikaika o ka lālā o luna o ka hoʻouna ʻana i nā kūlana - me ka hoʻonohonoho hou ʻana - a ua kāohi ʻia ka neʻe ʻana ma ka lalo e ka palena palena no ka hoʻomaka ʻana i ka node pili "ConditioningSetTimestepRange". I kēia manawa ua maopopo ke kumu e ʻōlelo ai kekahi poʻe nānā ʻAʻole hiki ke hoʻohana ʻia nā ʻōlelo kuhi hewa no SD3M, - ka hopena mai iā lākou (inā mākou e noʻonoʻo i kēia cyclogram kuhikuhi kikoʻī a manaʻo e pili nā lula like ma nā pūnaewele me ka hanauna pūnaewele e like me ka SD3 Medium model) he liʻiliʻi.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

Eia nō naʻe: inā ʻoe e lawe a hoʻopili pololei i ka puka o ka "CLIP Text Encode (Negative Prompt)" node me ka hoʻokomo ʻana o "KSampler" (a i ʻole e kaha i nā node waena āpau me nā kūlana ma kēia ala he "skipable", "Bypass", kahi e alakaʻi ai i ka hopena like), e ʻike ʻia ka maikaʻi o ke kiʻi hope loa. ʻO kēia, ma ke ala, hiki ke noʻonoʻo ʻia he hōʻike pololei ʻole o ke ʻano "ʻaʻole i pau" o SD3M, no ka mea, ʻo ka ʻōlelo ʻoiaʻiʻo, ua hiki i nā mea hoʻomohala ke hoʻoponopono i ka ikaika a me ke koʻikoʻi o ka hint maikaʻi ʻole ma mua o ka hoʻokuʻu ʻana i nā paona o ke kumu hoʻohālike i ka kahua lehulehu. ʻElua mau lālā o ka hoʻonohonoho akamai i nā kūlana no ka hoʻohana ʻana i kahi hint maikaʻi ʻole he ʻano pā, a ma kēia ʻano nā hoʻopiʻi mai ka poʻe hoihoi e hāʻule pololei ana ka "C". i nā manaʻolana i hāpai ʻia e ka ʻoihana kūʻai aku o Stability AI e pili ana iā ia, e nānā pono.

ʻO ka loaʻa ʻole o kahi manual pōkole pōkole no ka hana ʻana me SD3M ua alakaʻi i ka ʻoiaʻiʻo ke hoʻolaha nei nā lono ma ka Pūnaewele e pili ana kēia kumu hoʻohālike. ʻaʻole i aʻo ʻia e hoʻohana i nā hōʻailona maikaʻi ʻole. ʻO ia, ʻoiaʻiʻo, ʻaʻole ia he ʻoiaʻiʻo, akā i kēlā me kēia hihia, pono e hoʻopili ʻia kēia mau ʻōlelo aʻoaʻo ma kahi ʻano ʻokoʻa loa. ma mua o kēia i kamaʻāina i nā mea hoʻohana SD 1.5 a me SDXL. ʻO ka mea nui, hoʻopaʻapaʻa koʻikoʻi ka poʻe hoihoi i ka hoʻohui ʻana i nā wehewehe kikoʻī o nā mea ʻino e like me ka hiki i ke kahua maikaʻi ʻole (ʻae, ʻaʻole lawa ka "nsfw, nude" kahiko maikaʻi - pono ʻoe e hoʻolōʻihi i kou noʻonoʻo) alakaʻi i ka hoʻomaikaʻi ʻana i ka helehelena ʻo ke kaikamahine kaulana hoʻi e moe ana ma ka mauʻu. ʻAʻole hiki ke hoʻoholo inā he ʻoiaʻiʻo a ʻaʻole paha me ka nānā ʻole ʻana (a ʻaʻole ia he mea ʻoiaʻiʻo ʻo ka "18+" hōʻailona ma ke poʻo o kā mākou pūnaewele e pale i ka paʻi ʻana mai nā hoʻopiʻi mai ka poʻe huhū huhū o ka pono inā pilikia mākou i ka paʻi ʻana i kahi. ʻO ka "hōʻailona hana mana" i hui pū ʻia e nā mea hoihoi - ʻoiai ma ka ʻōlelo Pelekania). Hoʻomanaʻo kēia kūlana ʻakaʻaka i ka hanana me nā aʻo mua o ka wā kahiko e kūʻē i ka paganism, Mahalo i ia - pololei no ka mea i loaʻa iā lākou nā wehewehe kikoʻī o ka mea a me ke ʻano o ka poʻe Kristiano hanohano e hana ʻole - ma ka liʻiliʻi loa i hōʻike ʻia i nā hōʻike i kākau ʻia e pili ana i nā manaʻoʻiʻo a me nā loina o ka mua o ka Kristiano Rus '.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

I kēia manawa, makemake wau e manaʻoʻiʻo, ua ʻoi aku ka maopopo o ke kumu o ka ʻimi ʻana i ke aʻo ʻana o SD3M i kēia manawa ʻaʻole ia he mea hoʻopau kūpono loa o ka manawa a me ka hoʻoikaika. Aia maoli kekahi mea e kūkākūkā ai a e ʻimi ai: a i ʻōlelo ʻia i nā ʻāpana hanauna i koi ʻia i ka node "KSampler" (CFG - 4,5-5,0; helu o nā ʻanuʻu - ma kahi o 28; sampler/scheduler pair - wale nō dpmpp_2m/sgm_uniform, inā ʻaʻole ka maikaʻi o ka puka. hāʻule me ka ʻike); a he laha ko'iko'i loa i ka 'ano kumuhana o na hanauna me na palena ho'omaka like, aka me na anoano like'ole; a me ka wehe ʻana i ka "hōʻino o ka moe ʻana i ka mauʻu" (no ka mea hāʻawi ʻia nā haʻina maʻamau); a ʻo ka ʻoiaʻiʻo, e ʻike pono i nā palena o ka hanauna e hoʻopili ʻia e kēlā me kēia o nā mea hoʻololi kikokikona-to-token ʻekolu - a pehea, e hoʻohana ai iā lākou, e hoʻokō ai i nā haku hana maoli o ka Fine Art (inā hiki ke hana me kahi "C" ma ke kumu, ʻoiaʻiʻo).

Eia kekahi, ʻo ka hoʻokuʻu ʻia ʻana o Emad Mostak i Malaki a me ComfyAnonimous i Iune, a mamao loa ia lakou wale no, ʻaʻole wale nā ​​pilikia i loaʻa iā Stability AI. E like me ka hōʻike ʻana o Reuters e pili ana i ka The Information, ua hoʻomaka maoli kēia hoʻomaka Pelekane (i ka manawa e kākau ai i kēia ʻatikala) hoʻololi i ka luna hoʻokō ʻo ia ʻo Prem Akkaraju, kahi mea mālama o kahi pūʻulu kaulana kaulana o nā mea hoʻopukapuka IT - a ʻo ia hoʻi, ua mākaukau e ninini i ka nui o ke kālā i loko o ka hui (ke kamaʻilio nei mākou e pili ana i 80 miliona US kālā). ʻO ke kūlana o Stability AI ponoʻī ma ke ʻano he ʻoihana ʻoihana i kēia lā ʻaʻole paʻa; hoka ka nui wānana ka poʻe hoihoi i ka hopena wikiwiki no ia - a i loko o ia kūlana he mea paʻakikī ke manaʻo i ka ʻoihana e hana me ka noʻonoʻo ʻana ma luna o ia mau hewa maopopo.

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

ʻO ka mea pōʻino, ke mālama nei kahi kulekele laikini hewa ʻole i ke kaiāulu mai ka lawe kūʻokoʻa ʻana i ka SD3M i ka hua, e like me ka SD 1.5 a me SDXL. ʻO ka mea liʻiliʻi loa, ʻike ʻia nā ʻōkuhi derivative a me nā mea hana e like me LoRA no nā hiʻohiʻona ʻelua hope loa e loaʻa no ka hoʻokō kūloko, ʻoiai inā (a inā) hoʻopau ʻo Stability AI i kāna huakaʻi ma ke ʻano he ʻoihana kalepa. Ma hope koke iho o ke kuli o ka papa "C", ua hoʻomaka ka lohe ʻia ʻana o nā leo ma nā ʻaha kūkā kūikawā ma ka Pūnaewele i ke kākoʻo ʻana i ka hana ʻana i kahi papahana waiwai ʻole e hoʻomohala i kahi kumu hoʻohālike no ka hoʻololi ʻana i nā kikokikona i nā kiʻi e pili ana i ka crowdfunding - a i kēia manawa ke hoʻomaka nei kēia neʻe ʻana ma lalo o ka inoa Open Model Initiative. Invoke (kekahi o nā kahua no ka hanauna AI online, i kuhikuhi ʻia i nā studio ʻoihana), Comfy Org (kahi hui i hoʻolaʻa ʻia no ke kākoʻo a me ka hoʻomohala ʻana o ComfyUI), Civitai (ʻaʻole pono e hoʻolauna) a ua hoʻolaha mua ka hui ma hope o LAION i ko lākou mākaukau e hana ikaika. hui pū me ia (kahi waihona o nā kiʻi annotated, kahi i aʻo nui ʻia ai kēia mau ʻano hoʻohālike).

No laila, no ka wā e hiki mai ana, e kālele ana nā hoʻokuʻu Workshop hou i nā hiʻohiʻona i hana mua ʻia e ke kaiāulu i nā ʻano hoʻomaikaʻi like ʻole a me nā mea hana hou - nā hiʻohiʻona "hoʻokahi a me ka hapa" a me "Oversized". Malia paha e hiki mai ana ka manawa no ka lanakila o SD3M, akā paʻakikī ke kuhi i ka manawa pololei. I kēia manawa, hiki i ka poʻe hoihoi ke hoʻoiho i ka waihona e loaʻa ana nā hanauna SD3M i hōʻike ʻia ma kēia ʻatikala (ua hoʻohui pololei ʻia nā kiʻikuhi kaʻina i loko o nā faila PNG; e kauō wale i ke kiʻi mai File Explorer ma ka wahi hana ComfyUI). Windows, e hana hou i ke kauoha holoʻokoʻa a me nā palena o ka hanauna) maanei. Hiki paha i kekahi o kā mākou poʻe heluhelu ke ʻike i ke ala maikaʻi loa e kahele ʻana i nā kikokikona ma ʻekolu mau ʻāpana hint, no ka laʻana, ma mua o nā mea maʻamau o Reddit a me Hugging Face?

ʻatikala hou: Ke aʻo ʻana ma ke kaha kiʻi AI, ʻāpana ʻeiwa: SD3M - "C" no kahi C

Nā mea pili:

Ua hoʻololi ʻo Stability AI i ka hoʻokele a loaʻa iā $ 80 miliona i ka hoʻopukapuka.

Hoʻokomo ʻia ka mea hoʻoheheʻe kiʻi AI ʻo Stable Diffusion Medium, e koi wale ana i kahi kāleka wikiō me 5 GB o ka hoʻomanaʻo.

Hoʻopili ʻia ʻo Stability AI i ka aie a ke ʻimi nei i kahi mea kūʻai aku.

Hoʻomaka ʻo AI ʻo Stability AI e ʻoki i ka 10% o nā limahana ma muli o ka hoʻokūkū hoʻokūkū.

Ua hoʻolaha ʻia ʻo Stable Diffusion 3.0 - AI no ke kiʻi ʻana i ka hana hoʻololi a aʻo ʻia e kākau.

Source: 3dnews.ru

E kūʻai i ka hoʻokipa hilinaʻi no nā pūnaewele me ka pale DDoS, nā kikowaena VPS VDS 🔥 E kūʻai i ka hoʻokipa pūnaewele hilinaʻi me ka pale DDoS, nā kikowaena VPS VDS | ProHoster