ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ

ಸ್ಟೆಬಿಲಿಟಿ AI ಸ್ಥಿರ ಪ್ರಸರಣ ಯಂತ್ರ ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಯ ಎರಡನೇ ಆವೃತ್ತಿಯನ್ನು ಪ್ರಕಟಿಸಿದೆ, ಇದು ಸೂಚಿಸಿದ ಮಾದರಿ ಅಥವಾ ನೈಸರ್ಗಿಕ ಭಾಷೆಯ ಪಠ್ಯ ವಿವರಣೆಯನ್ನು ಆಧರಿಸಿ ಚಿತ್ರಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು ಮತ್ತು ಮಾರ್ಪಡಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ. ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ತರಬೇತಿ ಮತ್ತು ಇಮೇಜ್ ನಿರ್ಮಾಣಕ್ಕಾಗಿ ಪರಿಕರಗಳ ಕೋಡ್ ಅನ್ನು ಪೈಟಾರ್ಚ್ ಫ್ರೇಮ್‌ವರ್ಕ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಪೈಥಾನ್‌ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು MIT ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ಪ್ರಕಟಿಸಲಾಗಿದೆ. ಈಗಾಗಲೇ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳು ಕ್ರಿಯೇಟಿವ್ ML OpenRAIL-M ಅನುಮತಿ ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ತೆರೆದಿರುತ್ತವೆ, ಇದು ವಾಣಿಜ್ಯ ಬಳಕೆಯನ್ನು ಅನುಮತಿಸುತ್ತದೆ. ಹೆಚ್ಚುವರಿಯಾಗಿ, ಡೆಮೊ ಆನ್‌ಲೈನ್ ಇಮೇಜ್ ಜನರೇಟರ್ ಲಭ್ಯವಿದೆ.

ಸ್ಟೇಬಲ್ ಡಿಫ್ಯೂಷನ್‌ನ ಹೊಸ ಆವೃತ್ತಿಯಲ್ಲಿ ಪ್ರಮುಖ ಸುಧಾರಣೆಗಳು:

  • ಪಠ್ಯ ವಿವರಣೆಯ ಆಧಾರದ ಮೇಲೆ ಚಿತ್ರ ಸಂಶ್ಲೇಷಣೆಗಾಗಿ ಹೊಸ ಮಾದರಿಯನ್ನು ರಚಿಸಲಾಗಿದೆ - SD2.0-v - ಇದು 768×768 ರೆಸಲ್ಯೂಶನ್ ಹೊಂದಿರುವ ಚಿತ್ರಗಳ ಉತ್ಪಾದನೆಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಪಠ್ಯ ವಿವರಣೆಗಳೊಂದಿಗೆ 5 ಶತಕೋಟಿ ಚಿತ್ರಗಳ LAION-5.85B ಸಂಗ್ರಹವನ್ನು ಬಳಸಿಕೊಂಡು ಹೊಸ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲಾಗಿದೆ. ಮಾದರಿಯು ಸ್ಟೇಬಲ್ ಡಿಫ್ಯೂಷನ್ 1.5 ಮಾದರಿಯಂತೆ ಅದೇ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಬಳಸುತ್ತದೆ, ಆದರೆ ಮೂಲಭೂತವಾಗಿ ವಿಭಿನ್ನವಾದ OpenCLIP-ViT/H ಎನ್‌ಕೋಡರ್ ಅನ್ನು ಬಳಸುವ ಪರಿವರ್ತನೆಯಿಂದ ಭಿನ್ನವಾಗಿದೆ, ಇದು ಫಲಿತಾಂಶದ ಚಿತ್ರಗಳ ಗುಣಮಟ್ಟವನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಸುಧಾರಿಸಲು ಸಾಧ್ಯವಾಗಿಸಿತು.
    ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ
  • SD2.0-ಬೇಸ್‌ನ ಸರಳೀಕೃತ ಆವೃತ್ತಿಯನ್ನು ಸಿದ್ಧಪಡಿಸಲಾಗಿದೆ, ಶಾಸ್ತ್ರೀಯ ಶಬ್ದ ಮುನ್ಸೂಚನೆ ಮಾದರಿಯನ್ನು ಬಳಸಿಕೊಂಡು 256×256 ಚಿತ್ರಗಳ ಮೇಲೆ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ ಮತ್ತು 512×512 ರೆಸಲ್ಯೂಶನ್‌ನೊಂದಿಗೆ ಇಮೇಜ್ ಉತ್ಪಾದನೆಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ.
    ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ
  • ಪ್ರಾದೇಶಿಕ ಸ್ಕೇಲಿಂಗ್ ಮತ್ತು ವಿವರಗಳ ಪುನರ್ನಿರ್ಮಾಣಕ್ಕಾಗಿ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಗುಣಮಟ್ಟವನ್ನು ಕಡಿಮೆ ಮಾಡದೆ ಮೂಲ ಚಿತ್ರದ ರೆಸಲ್ಯೂಶನ್ ಅನ್ನು ಹೆಚ್ಚಿಸಲು ಸೂಪರ್ ಸ್ಯಾಂಪ್ಲಿಂಗ್ (ಸೂಪರ್ ರೆಸಲ್ಯೂಶನ್) ತಂತ್ರಜ್ಞಾನವನ್ನು ಬಳಸುವ ಸಾಧ್ಯತೆಯನ್ನು ಒದಗಿಸಲಾಗಿದೆ. ಒದಗಿಸಿದ ಇಮೇಜ್ ಪ್ರೊಸೆಸಿಂಗ್ ಮಾಡೆಲ್ (SD20-upscaler) 2048x ಅಪ್‌ಸ್ಕೇಲಿಂಗ್ ಅನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ, ಇದು 2048×XNUMX ರೆಸಲ್ಯೂಶನ್‌ನೊಂದಿಗೆ ಚಿತ್ರಗಳನ್ನು ರಚಿಸಬಹುದು.
    ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ
  • SD2.0-depth2img ಮಾದರಿಯನ್ನು ಪ್ರಸ್ತಾಪಿಸಲಾಗಿದೆ, ಇದು ವಸ್ತುಗಳ ಆಳ ಮತ್ತು ಪ್ರಾದೇಶಿಕ ವ್ಯವಸ್ಥೆಯನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ. MiDaS ವ್ಯವಸ್ಥೆಯನ್ನು ಮೊನೊಕ್ಯುಲರ್ ಡೆಪ್ತ್ ಅಂದಾಜುಗಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ. ಮಾದರಿಯು ಮತ್ತೊಂದು ಚಿತ್ರವನ್ನು ಟೆಂಪ್ಲೇಟ್ ಆಗಿ ಬಳಸಿಕೊಂಡು ಹೊಸ ಚಿತ್ರಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ, ಇದು ಮೂಲದಿಂದ ಆಮೂಲಾಗ್ರವಾಗಿ ಭಿನ್ನವಾಗಿರುತ್ತದೆ, ಆದರೆ ಒಟ್ಟಾರೆ ಸಂಯೋಜನೆ ಮತ್ತು ಆಳವನ್ನು ಉಳಿಸಿಕೊಳ್ಳುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ನೀವು ಅದೇ ಭಂಗಿಯಲ್ಲಿ ಮತ್ತೊಂದು ಪಾತ್ರವನ್ನು ರೂಪಿಸಲು ಫೋಟೋದಲ್ಲಿ ವ್ಯಕ್ತಿಯ ಭಂಗಿಯನ್ನು ಬಳಸಬಹುದು.
    ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ
    ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ
    ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ
  • ಚಿತ್ರಗಳನ್ನು ಮಾರ್ಪಡಿಸುವ ಮಾದರಿಯನ್ನು ನವೀಕರಿಸಲಾಗಿದೆ - SD 2.0-ಇನ್‌ಪೇಂಟಿಂಗ್, ಇದು ಪಠ್ಯ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಚಿತ್ರದ ಭಾಗಗಳನ್ನು ಬದಲಾಯಿಸಲು ಮತ್ತು ಬದಲಾಯಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ.
    ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ
  • ಒಂದೇ GPU ನೊಂದಿಗೆ ಸಾಂಪ್ರದಾಯಿಕ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಬಳಸಲು ಮಾದರಿಗಳನ್ನು ಹೊಂದುವಂತೆ ಮಾಡಲಾಗಿದೆ.

ಸ್ಥಿರ ಪ್ರಸರಣ 2.0 ಇಮೇಜ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪರಿಚಯಿಸಲಾಗಿದೆ


ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ