OpenAI ಪ್ರಸ್ತಾಪಿಸಿದ ಮಷಿನ್ ಲರ್ನಿಂಗ್ ಸಿಸ್ಟಮ್ DALL-E 2 ನ ಮುಕ್ತ ಅನುಷ್ಠಾನವನ್ನು ಪ್ರಕಟಿಸಲಾಗಿದೆ ಮತ್ತು ನೈಸರ್ಗಿಕ ಭಾಷೆಯಲ್ಲಿ ಪಠ್ಯ ವಿವರಣೆಯನ್ನು ಆಧರಿಸಿ ನೈಜ ಚಿತ್ರಗಳು ಮತ್ತು ವರ್ಣಚಿತ್ರಗಳನ್ನು ಸಂಯೋಜಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ, ಹಾಗೆಯೇ ಚಿತ್ರಗಳನ್ನು ಸಂಪಾದಿಸಲು ನೈಸರ್ಗಿಕ ಭಾಷೆಯಲ್ಲಿ ಆಜ್ಞೆಗಳನ್ನು ಅನ್ವಯಿಸುತ್ತದೆ ( ಉದಾಹರಣೆಗೆ, ಚಿತ್ರದಲ್ಲಿನ ವಸ್ತುಗಳನ್ನು ಸೇರಿಸಿ, ಅಳಿಸಿ ಅಥವಾ ಸರಿಸಿ ). OpenAI ನ ಮೂಲ DALL-E 2 ಮಾದರಿಗಳನ್ನು ಪ್ರಕಟಿಸಲಾಗಿಲ್ಲ, ಆದರೆ ವಿಧಾನವನ್ನು ವಿವರಿಸುವ ಕಾಗದವು ಲಭ್ಯವಿದೆ. ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ವಿವರಣೆಯನ್ನು ಆಧರಿಸಿ, ಸ್ವತಂತ್ರ ಸಂಶೋಧಕರು ಪೈಥಾನ್ನಲ್ಲಿ ಬರೆದ ಪರ್ಯಾಯ ಅನುಷ್ಠಾನವನ್ನು ಸಿದ್ಧಪಡಿಸಿದ್ದಾರೆ, ಪೈಟೋರ್ಚ್ ಚೌಕಟ್ಟನ್ನು ಬಳಸಿ ಮತ್ತು MIT ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ.
DALL-E ಯ ಮೊದಲ ತಲೆಮಾರಿನ ಹಿಂದೆ ಪ್ರಕಟವಾದ ಅನುಷ್ಠಾನಕ್ಕೆ ಹೋಲಿಸಿದರೆ, ಹೊಸ ಆವೃತ್ತಿಯು ವಿವರಣೆಗೆ ಚಿತ್ರದ ಹೆಚ್ಚು ನಿಖರವಾದ ಹೊಂದಾಣಿಕೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ, ಹೆಚ್ಚಿನ ಫೋಟೊರಿಯಲಿಸಂಗೆ ಅನುಮತಿಸುತ್ತದೆ ಮತ್ತು ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಶನ್ಗಳಲ್ಲಿ ಚಿತ್ರಗಳನ್ನು ರಚಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ. ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಸಿಸ್ಟಮ್ಗೆ ದೊಡ್ಡ ಸಂಪನ್ಮೂಲಗಳು ಬೇಕಾಗುತ್ತವೆ; ಉದಾಹರಣೆಗೆ, DALL-E 2 ನ ಮೂಲ ಆವೃತ್ತಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು GPU ನಲ್ಲಿ 100-200 ಸಾವಿರ ಗಂಟೆಗಳ ಕಂಪ್ಯೂಟಿಂಗ್ ಅಗತ್ಯವಿರುತ್ತದೆ, ಅಂದರೆ. 2 NVIDIA Tesla V4 GPUಗಳೊಂದಿಗೆ ಸುಮಾರು 256-100 ವಾರಗಳ ಲೆಕ್ಕಾಚಾರಗಳು.
ಅದೇ ಲೇಖಕರು ವಿಸ್ತೃತ ಆವೃತ್ತಿಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಪ್ರಾರಂಭಿಸಿದರು - DALLE2 ವೀಡಿಯೊ, ಪಠ್ಯ ವಿವರಣೆಯಿಂದ ವೀಡಿಯೊವನ್ನು ಸಂಶ್ಲೇಷಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ. ಪ್ರತ್ಯೇಕವಾಗಿ, ಮೊದಲ ತಲೆಮಾರಿನ DALL-E ನ ಮುಕ್ತ ಅನುಷ್ಠಾನದೊಂದಿಗೆ Sberbank ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ ರು-ಡಲ್ಲೆ ಯೋಜನೆಯನ್ನು ನಾವು ಗಮನಿಸಬಹುದು, ರಷ್ಯನ್ ಭಾಷೆಯಲ್ಲಿ ವಿವರಣೆಗಳನ್ನು ಗುರುತಿಸಲು ಅಳವಡಿಸಲಾಗಿದೆ.
ಮೂಲ: opennet.ru