ಪಠ್ಯ ವಿವರಣೆಯ ಆಧಾರದ ಮೇಲೆ ಚಿತ್ರ ಸಂಶ್ಲೇಷಣೆಗಾಗಿ ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆಯ ಅಳವಡಿಕೆ

OpenAI ಪ್ರಸ್ತಾಪಿಸಿದ ಮಷಿನ್ ಲರ್ನಿಂಗ್ ಸಿಸ್ಟಮ್ DALL-E 2 ನ ಮುಕ್ತ ಅನುಷ್ಠಾನವನ್ನು ಪ್ರಕಟಿಸಲಾಗಿದೆ ಮತ್ತು ನೈಸರ್ಗಿಕ ಭಾಷೆಯಲ್ಲಿ ಪಠ್ಯ ವಿವರಣೆಯನ್ನು ಆಧರಿಸಿ ನೈಜ ಚಿತ್ರಗಳು ಮತ್ತು ವರ್ಣಚಿತ್ರಗಳನ್ನು ಸಂಯೋಜಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ, ಹಾಗೆಯೇ ಚಿತ್ರಗಳನ್ನು ಸಂಪಾದಿಸಲು ನೈಸರ್ಗಿಕ ಭಾಷೆಯಲ್ಲಿ ಆಜ್ಞೆಗಳನ್ನು ಅನ್ವಯಿಸುತ್ತದೆ ( ಉದಾಹರಣೆಗೆ, ಚಿತ್ರದಲ್ಲಿನ ವಸ್ತುಗಳನ್ನು ಸೇರಿಸಿ, ಅಳಿಸಿ ಅಥವಾ ಸರಿಸಿ ). OpenAI ನ ಮೂಲ DALL-E 2 ಮಾದರಿಗಳನ್ನು ಪ್ರಕಟಿಸಲಾಗಿಲ್ಲ, ಆದರೆ ವಿಧಾನವನ್ನು ವಿವರಿಸುವ ಕಾಗದವು ಲಭ್ಯವಿದೆ. ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ವಿವರಣೆಯನ್ನು ಆಧರಿಸಿ, ಸ್ವತಂತ್ರ ಸಂಶೋಧಕರು ಪೈಥಾನ್‌ನಲ್ಲಿ ಬರೆದ ಪರ್ಯಾಯ ಅನುಷ್ಠಾನವನ್ನು ಸಿದ್ಧಪಡಿಸಿದ್ದಾರೆ, ಪೈಟೋರ್ಚ್ ಚೌಕಟ್ಟನ್ನು ಬಳಸಿ ಮತ್ತು MIT ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ.

ಪಠ್ಯ ವಿವರಣೆಯ ಆಧಾರದ ಮೇಲೆ ಚಿತ್ರ ಸಂಶ್ಲೇಷಣೆಗಾಗಿ ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆಯ ಅಳವಡಿಕೆಪಠ್ಯ ವಿವರಣೆಯ ಆಧಾರದ ಮೇಲೆ ಚಿತ್ರ ಸಂಶ್ಲೇಷಣೆಗಾಗಿ ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆಯ ಅಳವಡಿಕೆ

DALL-E ಯ ಮೊದಲ ತಲೆಮಾರಿನ ಹಿಂದೆ ಪ್ರಕಟವಾದ ಅನುಷ್ಠಾನಕ್ಕೆ ಹೋಲಿಸಿದರೆ, ಹೊಸ ಆವೃತ್ತಿಯು ವಿವರಣೆಗೆ ಚಿತ್ರದ ಹೆಚ್ಚು ನಿಖರವಾದ ಹೊಂದಾಣಿಕೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ, ಹೆಚ್ಚಿನ ಫೋಟೊರಿಯಲಿಸಂಗೆ ಅನುಮತಿಸುತ್ತದೆ ಮತ್ತು ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಶನ್‌ಗಳಲ್ಲಿ ಚಿತ್ರಗಳನ್ನು ರಚಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ. ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಸಿಸ್ಟಮ್ಗೆ ದೊಡ್ಡ ಸಂಪನ್ಮೂಲಗಳು ಬೇಕಾಗುತ್ತವೆ; ಉದಾಹರಣೆಗೆ, DALL-E 2 ನ ಮೂಲ ಆವೃತ್ತಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು GPU ನಲ್ಲಿ 100-200 ಸಾವಿರ ಗಂಟೆಗಳ ಕಂಪ್ಯೂಟಿಂಗ್ ಅಗತ್ಯವಿರುತ್ತದೆ, ಅಂದರೆ. 2 NVIDIA Tesla V4 GPUಗಳೊಂದಿಗೆ ಸುಮಾರು 256-100 ವಾರಗಳ ಲೆಕ್ಕಾಚಾರಗಳು.

ಪಠ್ಯ ವಿವರಣೆಯ ಆಧಾರದ ಮೇಲೆ ಚಿತ್ರ ಸಂಶ್ಲೇಷಣೆಗಾಗಿ ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆಯ ಅಳವಡಿಕೆ

ಅದೇ ಲೇಖಕರು ವಿಸ್ತೃತ ಆವೃತ್ತಿಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಪ್ರಾರಂಭಿಸಿದರು - DALLE2 ವೀಡಿಯೊ, ಪಠ್ಯ ವಿವರಣೆಯಿಂದ ವೀಡಿಯೊವನ್ನು ಸಂಶ್ಲೇಷಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ. ಪ್ರತ್ಯೇಕವಾಗಿ, ಮೊದಲ ತಲೆಮಾರಿನ DALL-E ನ ಮುಕ್ತ ಅನುಷ್ಠಾನದೊಂದಿಗೆ Sberbank ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ ರು-ಡಲ್ಲೆ ಯೋಜನೆಯನ್ನು ನಾವು ಗಮನಿಸಬಹುದು, ರಷ್ಯನ್ ಭಾಷೆಯಲ್ಲಿ ವಿವರಣೆಗಳನ್ನು ಗುರುತಿಸಲು ಅಳವಡಿಸಲಾಗಿದೆ.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ