Facebook 200 ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುವ ಯಂತ್ರ ಅನುವಾದ ಮಾದರಿಯನ್ನು ಪ್ರಕಟಿಸುತ್ತದೆ

ಫೇಸ್‌ಬುಕ್ (ರಷ್ಯನ್ ಒಕ್ಕೂಟದಲ್ಲಿ ನಿಷೇಧಿಸಲಾಗಿದೆ) NLLB (ಯಾವುದೇ ಭಾಷೆ ಉಳಿದಿಲ್ಲ) ಯೋಜನೆಯ ಬೆಳವಣಿಗೆಗಳನ್ನು ಪ್ರಕಟಿಸಿದೆ, ಪಠ್ಯವನ್ನು ಒಂದು ಭಾಷೆಯಿಂದ ಇನ್ನೊಂದು ಭಾಷೆಗೆ ನೇರವಾಗಿ ಭಾಷಾಂತರಿಸಲು ಸಾರ್ವತ್ರಿಕ ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ರಚಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ, ಮಧ್ಯಂತರ ಅನುವಾದವನ್ನು ಇಂಗ್ಲಿಷ್‌ಗೆ ಬೈಪಾಸ್ ಮಾಡುತ್ತದೆ. ಪ್ರಸ್ತಾವಿತ ಮಾದರಿಯು ಆಫ್ರಿಕನ್ ಮತ್ತು ಆಸ್ಟ್ರೇಲಿಯನ್ ಜನರ ಅಪರೂಪದ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಂತೆ 200 ಕ್ಕೂ ಹೆಚ್ಚು ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಯಾವುದೇ ಜನರಿಗೆ ಅವರು ಮಾತನಾಡುವ ಭಾಷೆಯನ್ನು ಲೆಕ್ಕಿಸದೆ ಸಂವಹನಕ್ಕಾಗಿ ಸಾಧನವನ್ನು ಒದಗಿಸುವುದು ಯೋಜನೆಯ ಅಂತಿಮ ಗುರಿಯಾಗಿದೆ.

ಮಾದರಿಯು ಕ್ರಿಯೇಟಿವ್ ಕಾಮನ್ಸ್ BY-NC 4.0 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿದೆ, ಇದು ನಕಲು, ಮರುಹಂಚಿಕೆ, ಗ್ರಾಹಕೀಕರಣ ಮತ್ತು ವ್ಯುತ್ಪನ್ನ ಕಾರ್ಯಗಳನ್ನು ಅನುಮತಿಸುತ್ತದೆ, ನೀವು ಗುಣಲಕ್ಷಣವನ್ನು ನೀಡಿದರೆ, ಪರವಾನಗಿಯನ್ನು ನಿರ್ವಹಿಸಿ ಮತ್ತು ಅದನ್ನು ವಾಣಿಜ್ಯೇತರ ಉದ್ದೇಶಗಳಿಗಾಗಿ ಮಾತ್ರ ಬಳಸಿ. ಮಾದರಿಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಪರಿಕರಗಳನ್ನು MIT ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ಒದಗಿಸಲಾಗಿದೆ. NLLB ಮಾದರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಅಭಿವೃದ್ಧಿಯನ್ನು ಉತ್ತೇಜಿಸಲು, ಸಂಶೋಧಕರಿಗೆ ಅನುದಾನವನ್ನು ಒದಗಿಸಲು $ 200 ಸಾವಿರವನ್ನು ನಿಯೋಜಿಸಲು ನಿರ್ಧರಿಸಲಾಯಿತು.

ಪ್ರಸ್ತಾವಿತ ಮಾದರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಯೋಜನೆಗಳ ರಚನೆಯನ್ನು ಸರಳಗೊಳಿಸಲು, ಮಾದರಿಗಳ ಗುಣಮಟ್ಟವನ್ನು ಪರೀಕ್ಷಿಸಲು ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಬಳಸುವ ಅಪ್ಲಿಕೇಶನ್‌ಗಳ ಕೋಡ್ (FLORES-200, NLLB-MD, ಟಾಕ್ಸಿಸಿಟಿ -200), ತರಬೇತಿ ಮಾದರಿಗಳು ಮತ್ತು LASER3 ಲೈಬ್ರರಿ ಆಧಾರಿತ ಎನ್‌ಕೋಡರ್‌ಗಳಿಗೆ ಕೋಡ್ ( ಭಾಷೆ-ಅಜ್ಞೇಯತಾವಾದಿ ವಾಕ್ಯ) ಹೆಚ್ಚುವರಿಯಾಗಿ ತೆರೆದ ಮೂಲವಾಗಿದೆ. ಪ್ರಾತಿನಿಧ್ಯ). ಅಂತಿಮ ಮಾದರಿಯನ್ನು ಎರಡು ಆವೃತ್ತಿಗಳಲ್ಲಿ ನೀಡಲಾಗುತ್ತದೆ - ಪೂರ್ಣ ಮತ್ತು ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಲಾಗಿದೆ. ಸಂಕ್ಷಿಪ್ತ ಆವೃತ್ತಿಗೆ ಕಡಿಮೆ ಸಂಪನ್ಮೂಲಗಳು ಬೇಕಾಗುತ್ತವೆ ಮತ್ತು ಸಂಶೋಧನಾ ಯೋಜನೆಗಳಲ್ಲಿ ಪರೀಕ್ಷೆ ಮತ್ತು ಬಳಕೆಗೆ ಸೂಕ್ತವಾಗಿದೆ.

ಯಂತ್ರ ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಆಧರಿಸಿದ ಇತರ ಅನುವಾದ ವ್ಯವಸ್ಥೆಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ಫೇಸ್‌ಬುಕ್‌ನ ಪರಿಹಾರವು ಗಮನಾರ್ಹವಾಗಿದೆ, ಇದು ಎಲ್ಲಾ 200 ಭಾಷೆಗಳಿಗೆ ಒಂದು ಸಾಮಾನ್ಯ ಮಾದರಿಯನ್ನು ನೀಡುತ್ತದೆ, ಎಲ್ಲಾ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ ಮತ್ತು ಪ್ರತಿ ಭಾಷೆಗೆ ಪ್ರತ್ಯೇಕ ಮಾದರಿಗಳ ಬಳಕೆಯ ಅಗತ್ಯವಿಲ್ಲ. ಇಂಗ್ಲಿಷ್‌ಗೆ ಮಧ್ಯಂತರ ಅನುವಾದವಿಲ್ಲದೆಯೇ ಮೂಲ ಭಾಷೆಯಿಂದ ಗುರಿ ಭಾಷೆಗೆ ಅನುವಾದವನ್ನು ನೇರವಾಗಿ ನಡೆಸಲಾಗುತ್ತದೆ. ಸಾರ್ವತ್ರಿಕ ಅನುವಾದ ವ್ಯವಸ್ಥೆಗಳನ್ನು ರಚಿಸಲು, ಒಂದು LID ಮಾದರಿಯನ್ನು (ಭಾಷಾ ಗುರುತಿಸುವಿಕೆ) ಹೆಚ್ಚುವರಿಯಾಗಿ ಪ್ರಸ್ತಾಪಿಸಲಾಗಿದೆ, ಇದು ಬಳಸಿದ ಭಾಷೆಯನ್ನು ನಿರ್ಧರಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ. ಆ. ಯಾವ ಭಾಷೆಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಒದಗಿಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ಸಿಸ್ಟಮ್ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಗುರುತಿಸಬಹುದು ಮತ್ತು ಅದನ್ನು ಬಳಕೆದಾರರ ಭಾಷೆಗೆ ಅನುವಾದಿಸಬಹುದು.

200 ಬೆಂಬಲಿತ ಭಾಷೆಗಳ ನಡುವೆ ಯಾವುದೇ ದಿಕ್ಕಿನಲ್ಲಿ ಅನುವಾದವನ್ನು ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ. ಯಾವುದೇ ಭಾಷೆಗಳ ನಡುವಿನ ಅನುವಾದದ ಗುಣಮಟ್ಟವನ್ನು ದೃಢೀಕರಿಸಲು, FLORES-200 ಉಲ್ಲೇಖ ಪರೀಕ್ಷಾ ಸೆಟ್ ಅನ್ನು ಸಿದ್ಧಪಡಿಸಲಾಗಿದೆ, ಇದು ಭಾಷಾಂತರ ಗುಣಮಟ್ಟದಲ್ಲಿ NLLB-200 ಮಾದರಿಯು ಈ ಹಿಂದೆ ಪ್ರಸ್ತಾಪಿಸಲಾದ ಯಂತ್ರ ಕಲಿಕೆ ಆಧಾರಿತ ಸಂಶೋಧನಾ ವ್ಯವಸ್ಥೆಗಳಿಗಿಂತ ಸರಾಸರಿ 44% ಉತ್ತಮವಾಗಿದೆ ಎಂದು ತೋರಿಸಿದೆ. BLEU ಮೆಟ್ರಿಕ್ಸ್ ಯಂತ್ರ ಅನುವಾದವನ್ನು ಪ್ರಮಾಣಿತ ಮಾನವ ಅನುವಾದದೊಂದಿಗೆ ಹೋಲಿಸುತ್ತದೆ. ಅಪರೂಪದ ಆಫ್ರಿಕನ್ ಭಾಷೆಗಳು ಮತ್ತು ಭಾರತೀಯ ಉಪಭಾಷೆಗಳಿಗೆ, ಗುಣಮಟ್ಟದ ಶ್ರೇಷ್ಠತೆಯು 70% ತಲುಪುತ್ತದೆ. ವಿಶೇಷವಾಗಿ ಸಿದ್ಧಪಡಿಸಿದ ಡೆಮೊ ಸೈಟ್‌ನಲ್ಲಿ ಅನುವಾದದ ಗುಣಮಟ್ಟವನ್ನು ದೃಷ್ಟಿಗೋಚರವಾಗಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಸಾಧ್ಯವಿದೆ.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ