БистСмы машинного обучСния для синтСза ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΈ подавлСния ΡˆΡƒΠΌΠΎΠ² Π½Π° Π½ΠΎΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ‚ΠΎ

Компания Stability AI ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° Π³ΠΎΡ‚ΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ для систСмы машинного обучСния Stable Diffusion, способной ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒ изобраТСния Π½Π° основС тСкстового описания Π½Π° СстСствСнном языкС. МодСли ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ ΠΏΠΎΠ΄ пСрмиссивной Π»ΠΈΡ†Π΅Π½Π·ΠΈΠ΅ΠΉ Creative ML OpenRAIL-M, Π΄ΠΎΠΏΡƒΡΠΊΠ°ΡŽΡ‰Π΅ΠΉ использованиС Π² коммСрчСских цСлях. Для обучСния систСмы использовался кластСр ΠΈΠ· 4000 GPU NVIDIA A100 Ezra-1 ΠΈ коллСкция LAION-5B, Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰Π°Ρ 5.85 ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄ΠΎΠ² ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ с тСкстовыми описаниями. Π Π°Π½Π΅Π΅ ΠΏΠΎΠ΄ Π»ΠΈΡ†Π΅Π½Π·ΠΈΠ΅ΠΉ MIT Π±Ρ‹Π» ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ ΠΊΠΎΠ΄ инструмСнтов для обучСния Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти ΠΈ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ.

Π”ΠΎΡΡ‚ΡƒΠΏΠ½ΠΎΡΡ‚ΡŒ Π³ΠΎΡ‚ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ достаточно скромныС систСмныС трСбования, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΠ΅ Π½Π°Ρ‡Π°Ρ‚ΡŒ экспСримСнты Π½Π° ПК с Ρ‚ΠΈΠΏΠΎΠ²Ρ‹ΠΌΠΈ GPU, ΠΏΡ€ΠΈΠ²Π΅Π»Π° ΠΊ появлСнию ряда смСТных ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ²:

  • textual-inversion (ΠΊΠΎΠ΄) — надстройка, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π°Ρ ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ изобраТСния с Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ пСрсонаТСм, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠΌ ΠΈΠ»ΠΈ стилСм. Π’ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΌ Stable Diffusion ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π² синтСзируСмых изобраТСниях случайны ΠΈ Π½Π΅ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹. ΠŸΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Π°Ρ надстройка позволяСт Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ собствСнныС Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, ΠΏΡ€ΠΈΠ²ΡΠ·Π°Ρ‚ΡŒ ΠΈΡ… ΠΊ ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹ΠΌ словам ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈ синтСзС.

    НапримСр, Π² ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΌ Stable Diffusion ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠΏΡ€ΠΎΡΠΈΡ‚ΡŒ систСму ΡΡ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ с «ΠΊΠΎΡˆΠΊΠΎΠΉ Π² Π»ΠΎΠ΄ΠΊΠ΅». Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΡƒΡ‚ΠΎΡ‡Π½ΠΈΡ‚ΡŒ характСристики кошки ΠΈ Π»ΠΎΠ΄ΠΊΠΈ, Π½ΠΎ нСпрСдсказуСмо, какая ΠΈΠΌΠ΅Π½Π½ΠΎ кошка ΠΈ Π»ΠΎΠ΄ΠΊΠ° Π±ΡƒΠ΄ΡƒΡ‚ синтСзированы. Textual-inversion позволяСт ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ систСму ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ своСй кошки ΠΈΠ»ΠΈ Π»ΠΎΠ΄ΠΊΠΈ ΠΈ ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ с ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ кошкой ΠΈΠ»ΠΈ Π»ΠΎΠ΄ΠΊΠΎΠΉ. ΠŸΠΎΠ΄ΠΎΠ±Π½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°ΠΌΠ΅Π½ΡΡ‚ΡŒ элСмСнты изобраТСния Π½Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½Ρ‹Π΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, Π·Π°Π΄Π°Π²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ стиля для синтСза ΠΈ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ понятия (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΈΠ· всСго многообразия Π΄ΠΎΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΡƒΡŽ ΠΈ ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅Π½Π½ΡƒΡŽ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ Π² Π½ΡƒΠΆΠ½ΠΎΠΌ стилС).

    БистСмы машинного обучСния для синтСза ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΈ подавлСния ΡˆΡƒΠΌΠΎΠ² Π½Π° Π½ΠΎΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ‚ΠΎ

  • stable-diffusion-animation — созданиС Π°Π½ΠΈΠΌΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… (двиТущихся) ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Π½Π° основС интСрполяции ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ°ΠΌΠΈ, сформированными Π² Stable Diffusion.
  • stable_diffusion.openvino (ΠΊΠΎΠ΄) — ΠΏΠΎΡ€Ρ‚ Stable Diffusion, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ для вычислСний ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ CPU, Ρ‡Ρ‚ΠΎ позволяСт ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π° систСмах Π±Π΅Π· ΠΌΠΎΡ‰Π½Ρ‹Ρ… GPU. Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ трСбуСтся процСссор, ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅ΠΌΡ‹ΠΉ Π² Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ΅ OpenVINO. ΠžΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎ Π² OpenVINO прСдоставлСны ΠΏΠ»Π°Π³ΠΈΠ½Ρ‹ для процСссоров Intel с Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΡΠΌΠΈ AVX2, AVX-512, AVX512_BF16 ΠΈ SSE, Π° Ρ‚Π°ΠΊΠΆΠ΅ для ΠΏΠ»Π°Ρ‚ Raspberry Pi 4 Model B, Apple Mac mini ΠΈ NVIDIA Jetson Nano. ΠΠ΅ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ использованиС OpenVINO ΠΈ Π½Π° процСссорах AMD Ryzen.
  • sdamd — ΠΏΠΎΡ€Ρ‚ для GPU AMD.
  • ΠΠ°Ρ‡Π°Π»ΡŒΠ½Π°Ρ рСализация синтСза Π²ΠΈΠ΄Π΅ΠΎ.
  • stable-diffusion-gui, stable-diffusion-ui, Artbreeder Collage, diffuse-the-rest — графичСскиС интСрфСйсы для Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Stable Diffusion.
  • beta.dreamstudio.ai, Hugging Face Spaces, hlky Stable Diffusion WebUI — web-интСрфСйсы для синтСза ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Stable Diffusion.
  • ΠŸΠ»Π°Π³ΠΈΠ½Ρ‹ для ΠΈΠ½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΠΈ Stable Diffusion с GIMP, Figma, Blender ΠΈ Photoshop.

Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΡŽ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠ΅ΠΉ Google ΠΊΠΎΠ΄Π° систСмы машинного обучСния RawNeRF (RAW Neural Radiance Fields), ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π΅ΠΉ Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… RAW-ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, ΠΏΠΎΠ²Ρ‹ΡˆΠ°Ρ‚ΡŒ качСство сильно Π·Π°ΡˆΡƒΠΌΠ»Π΅Π½Π½Ρ‹Ρ… снимков, снятых Π² Ρ‚Π΅ΠΌΠ½ΠΎΡ‚Π΅ ΠΈ ΠΏΡ€ΠΈ ΠΏΠ»ΠΎΡ…ΠΎΠΌ освСщСнии. ΠšΡ€ΠΎΠΌΠ΅ устранСния ΡˆΡƒΠΌΠΎΠ² Ρ€Π°Π·Π²ΠΈΠ²Π°Π΅ΠΌΡ‹Π΅ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠΌ инструмСнты ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΠΏΠΎΠ²Ρ‹ΡˆΠ°Ρ‚ΡŒ Π΄Π΅Ρ‚Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ, ΡƒΡΡ‚Ρ€Π°Π½ΡΡ‚ΡŒ Π±Π»ΠΈΠΊΠΈ, ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ HDR ΠΈ ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒ ΠΎΠ±Ρ‰Π΅Π΅ освСщСниС Π½Π° фотографиях, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎ нСскольким снимкам c Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ ракурсами Π²ΠΎΡΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ Ρ‚Ρ€Ρ‘Ρ…ΠΌΠ΅Ρ€Π½ΠΎΠ΅ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΡΠ΄Π²ΠΈΠ³Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΡƒ ΠΎΠ±Π·ΠΎΡ€Π°, ΠΌΠ°Π½ΠΈΠΏΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ фокусом ΠΈ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ двиТущиСся ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ.

БистСмы машинного обучСния для синтСза ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΈ подавлСния ΡˆΡƒΠΌΠΎΠ² Π½Π° Π½ΠΎΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ‚ΠΎ
БистСмы машинного обучСния для синтСза ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΈ подавлСния ΡˆΡƒΠΌΠΎΠ² Π½Π° Π½ΠΎΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ‚ΠΎ


Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: opennet.ru