Sistèm aprantisaj machin pou sentèz imaj ak rediksyon bri nan foto lannwit

Estabilite AI te pibliye modèl ki pare pou sistèm aprantisaj machin Stable Diffusion, ki kapab fè sentèz ak modifye imaj ki baze sou yon deskripsyon tèks nan lang natirèl. Modèl yo gen lisans anba yon lisans ki pèmèt Creative ML OpenRAIL-M pou itilizasyon komèsyal yo. Pou fòme sistèm nan, yo te itilize yon gwoup 4000 GPU NVIDIA A100 Ezra-1 ak yon koleksyon LAION-5B, ki gen ladan 5.85 milya imaj ak deskripsyon tèks. Anvan sa, kòd pou zouti pou fòme yon rezo neral ak jenere imaj yo te louvri sous lisans MIT.

Disponibilite yon modèl pare ak kondisyon sistèm jistis modès ki pèmèt yon moun kòmanse eksperyans sou yon PC ak GPU estanda te mennen nan aparisyon nan yon kantite pwojè ki gen rapò:

  • tèks-envèsyon (kòd) - yon adisyon ki pèmèt ou fè sentèz imaj ak yon karaktè, objè oswa style bay yo. Nan orijinal Difizyon ki estab, objè yo nan imaj sentèz yo o aza ak enkontwolab. Add-on pwopoze a pèmèt ou ajoute pwòp objè vizyèl ou, mare yo ak mo kle epi sèvi ak yo nan sentèz.

    Pou egzanp, nan regilye Difizyon ki estab ou ka mande sistèm nan jenere yon imaj ak yon "chat nan yon bato". Anplis de sa, ou ka klarifye karakteristik sa yo nan chat la ak bato a, men li se enprevizib ki chat ak bato yo pral sentèz. Textual-envèrsyon pèmèt ou fòme sistèm lan sou yon imaj chat ou oswa bato ak sentèz imaj la ak yon chat espesifik oswa bato. Nan yon fason menm jan an, li kapab tou ranplase eleman imaj ak sèten objè, mete yon egzanp nan yon style vizyèl pou sentèz, epi presize konsèp (pou egzanp, soti nan tout varyete doktè, ou ka itilize yon seleksyon ki pi egzak ak-wo kalite. nan style la vle).

    Sistèm aprantisaj machin pou sentèz imaj ak rediksyon bri nan foto lannwit

  • stable-diffusion-animation - kreyasyon imaj anime (k ap deplase) ki baze sou entèpolasyon ant foto ki te pwodwi nan Stable Diffusion.
  • stable_diffusion.openvino (kòd) - yon pò nan Stable Diffusion, ki itilize sèlman CPU a pou kalkil, ki pèmèt eksperimantasyon sou sistèm san GPU pwisan. Mande pou yon processeur sipòte nan bibliyotèk OpenVINO la. Ofisyèlman, OpenVINO bay grefon pou processeur Intel ak ekstansyon AVX2, AVX-512, AVX512_BF16 ak SSE, osi byen ke pou Raspberry Pi 4 Modèl B, Apple Mac mini ak NVIDIA Jetson Nano ankadreman. Ofisyèlman, li posib pou itilize OpenVINO sou processeurs AMD Ryzen.
  • sdamd se yon pò pou GPU AMD.
  • Yon premye aplikasyon sentèz videyo.
  • stable-diffusion-gui, stable-diffusion-ui, Artbreeder Collage, diffuse-the-rest - entèfas grafik pou jenere imaj lè l sèvi avèk Stable Diffusion.
  • beta.dreamstudio.ai, Hugging Face Spaces, hlky Stable Diffusion WebUI - entèfas entènèt pou sentèz imaj lè l sèvi avèk Stable Diffusion.
  • Plugins pou entegre Stable Diffusion ak GIMP, Figma, Blender ak fotoschop.

Anplis de sa, nou ka sonje piblikasyon Google kòd sistèm aprantisaj machin RawNeRF (RAW Neural Radiance Fields) ki pèmèt, baze sou done ki soti nan plizyè imaj RAW, amelyore kalite imaj ki fè anpil bwi yo pran nan fè nwa ak nan pòv ekleraj. Anplis de sa nan elimine bri, zouti yo devlope pa pwojè a fè li posib ogmante detay, elimine ekla, sentèz HDR ak chanje ekleraj la an jeneral nan foto, osi byen ke rkree pozisyon nan twa dimansyon nan objè lè l sèvi avèk plizyè foto ki soti nan ang diferan, chanje pwen de vi, manipile konsantre ak jenere foto k ap deplase.

Sistèm aprantisaj machin pou sentèz imaj ak rediksyon bri nan foto lannwit
Sistèm aprantisaj machin pou sentèz imaj ak rediksyon bri nan foto lannwit


Sous: opennet.ru

Add nouvo kòmantè