ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಇಂಟೆಲಿಜೆನ್ಸ್ ಹರ್ಟ್ಜ್-ದೇವನ ಪ್ರಕಟಣೆಯನ್ನು ಘೋಷಿಸಿತು, ಇದು ಪೂರ್ಣ-ಡ್ಯೂಪೆಕ್ಸ್ ಭಾಷಣ ಸಂಶ್ಲೇಷಣೆಗಾಗಿ ಮೊದಲ ತೆರೆದ AI ಮಾದರಿಯಾಗಿದೆ, ಇದನ್ನು ನೈಜ-ಸಮಯದ ಧ್ವನಿ ಸಂವಹನ ಅಥವಾ ಮಾತನಾಡುವ ಭಾಷಾ ಉತ್ಪಾದನೆಯ ವ್ಯವಸ್ಥೆಗಳನ್ನು ನಿರ್ಮಿಸಲು ಆಧಾರವಾಗಿ ಬಳಸಬಹುದು. ಮಾದರಿಯು ಭಾಷಣವನ್ನು ರಚಿಸಬಹುದು, ಅದು ತರಬೇತಿ ಪಡೆದ ಧ್ವನಿ ಡೇಟಾವನ್ನು ಹೋಲುತ್ತದೆ, ಅಸ್ಥಿರ ದೂರವಾಣಿ ಸಂಭಾಷಣೆಯ ವಿಳಂಬವಿಲ್ಲದೆ ಮಾನವ-ಶೈಲಿಯ ಸಂವಹನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಯೋಜನೆಯ ಬೆಳವಣಿಗೆಗಳನ್ನು ಅಪಾಚೆ 2.0 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ.
NVIDIA GeForce RTX 4090 GPU ಹೊಂದಿರುವ ಸಿಸ್ಟಂನಲ್ಲಿ, ಸರಾಸರಿ ಪೂರ್ವ-ಪೀಳಿಗೆಯ ಲೇಟೆನ್ಸಿಯು 120 ms ಆಗಿದೆ (ಸೈದ್ಧಾಂತಿಕವಾಗಿ 65 ms ವರೆಗೆ), ಇದು ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿರುವ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಮಾದರಿಗಳಿಗಿಂತ ಎರಡು ಪಟ್ಟು ವೇಗವಾಗಿರುತ್ತದೆ. ಪ್ರಕಟಿತ ಆವೃತ್ತಿಯನ್ನು ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಬಳಸಿ ನಿರ್ಮಿಸಲಾಗಿದೆ, 8.5 ಬಿಲಿಯನ್ ಪ್ಯಾರಾಮೀಟರ್ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ ಮತ್ತು 500 ಬಿಲಿಯನ್ ಟೋಕನ್ಗಳನ್ನು ಬಳಸಿ ತರಬೇತಿ ನೀಡಲಾಗುತ್ತದೆ. ಮಾದರಿಯು ಗಣನೆಗೆ ತೆಗೆದುಕೊಂಡ ಸಂದರ್ಭದ ಗಾತ್ರ (ಮಾದರಿಯು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಬಹುದಾದ ಮತ್ತು ಭಾಷಣವನ್ನು ರಚಿಸುವಾಗ ನೆನಪಿಡುವ ಟೋಕನ್ಗಳ ಸಂಖ್ಯೆ) 2048 ಟೋಕನ್ಗಳು ಅಥವಾ ಸುಮಾರು 4 ನಿಮಿಷಗಳ ಭಾಷಣವಾಗಿದೆ.
ಮೂಲ: opennet.ru
