فیس بک نے مشینی ترجمہ کا ماڈل شائع کیا ہے جو 200 زبانوں کو سپورٹ کرتا ہے۔

فیس بک (روسی فیڈریشن میں ممنوع) نے NLLB (No Language Left Behind) پروجیکٹ کی پیشرفت شائع کی ہے، جس کا مقصد انگریزی میں انٹرمیڈیٹ ترجمہ کو نظرانداز کرتے ہوئے متن کو ایک زبان سے دوسری زبان میں براہ راست ترجمہ کرنے کے لیے ایک عالمگیر مشین لرننگ ماڈل بنانا ہے۔ مجوزہ ماڈل 200 سے زائد زبانوں پر محیط ہے، جن میں افریقی اور آسٹریلوی لوگوں کی نایاب زبانیں بھی شامل ہیں۔ منصوبے کا حتمی مقصد کسی بھی لوگوں کے لیے بات چیت کا ذریعہ فراہم کرنا ہے، چاہے وہ کسی بھی زبان میں بولیں۔

ماڈل کو Creative Commons BY-NC 4.0 لائسنس کے تحت لائسنس دیا گیا ہے، جو کاپی کرنے، دوبارہ تقسیم کرنے، حسب ضرورت بنانے، اور اخذ کرنے والے کاموں کی اجازت دیتا ہے، بشرطیکہ آپ انتساب دیں، لائسنس برقرار رکھیں، اور اسے صرف غیر تجارتی مقاصد کے لیے استعمال کریں۔ ماڈلز کے ساتھ کام کرنے کے اوزار MIT لائسنس کے تحت فراہم کیے جاتے ہیں۔ NLLB ماڈل کا استعمال کرتے ہوئے ترقی کو تیز کرنے کے لیے، محققین کو گرانٹ فراہم کرنے کے لیے $200 ہزار مختص کرنے کا فیصلہ کیا گیا۔

مجوزہ ماڈل کا استعمال کرتے ہوئے پراجیکٹس کی تخلیق کو آسان بنانے کے لیے، ماڈلز کے معیار کو جانچنے اور جانچنے کے لیے استعمال ہونے والے ایپلیکیشنز کا کوڈ (FLORES-200, NLLB-MD, Toxicity-200)، LASER3 لائبریری پر مبنی ٹریننگ ماڈلز اور انکوڈرز کے لیے کوڈ ( Language-Agnostic Sentence) اضافی طور پر اوپن سورس ہیں۔ نمائندگی)۔ حتمی ماڈل دو ورژن میں پیش کیا جاتا ہے - مکمل اور مختصر۔ مختصر ورژن کے لیے کم وسائل درکار ہیں اور یہ تحقیقی منصوبوں میں جانچ اور استعمال کے لیے موزوں ہے۔

مشین لرننگ سسٹم پر مبنی دیگر ترجمے کے نظام کے برعکس، فیس بک کا حل اس لحاظ سے قابل ذکر ہے کہ یہ تمام 200 زبانوں کے لیے ایک عام ماڈل پیش کرتا ہے، تمام زبانوں کا احاطہ کرتا ہے اور ہر زبان کے لیے الگ الگ ماڈل استعمال کرنے کی ضرورت نہیں ہے۔ ترجمہ انگریزی میں درمیانی ترجمہ کے بغیر، ماخذ کی زبان سے براہ راست ہدف کی زبان میں کیا جاتا ہے۔ یونیورسل ٹرانسلیشن سسٹم بنانے کے لیے، ایک LID ماڈل (Language Identification) بھی تجویز کیا گیا ہے، جو استعمال شدہ زبان کا تعین کرنا ممکن بناتا ہے۔ وہ. سسٹم خود بخود پہچان سکتا ہے کہ کس زبان میں معلومات فراہم کی گئی ہیں اور اسے صارف کی زبان میں ترجمہ کر سکتے ہیں۔

ترجمہ کسی بھی سمت میں، 200 تعاون یافتہ زبانوں میں سے کسی کے درمیان تعاون یافتہ ہے۔ کسی بھی زبان کے درمیان ترجمہ کے معیار کی تصدیق کرنے کے لیے، FLORES-200 ریفرنس ٹیسٹ سیٹ تیار کیا گیا، جس سے معلوم ہوا کہ ترجمہ کے معیار کے لحاظ سے NLLB-200 ماڈل پہلے کے مجوزہ مشین لرننگ پر مبنی تحقیقی نظاموں سے اوسطاً 44 فیصد بہتر ہے۔ معیاری انسانی ترجمہ کے ساتھ مشینی ترجمہ کا موازنہ کرنے والی BLEU میٹرکس۔ نایاب افریقی زبانوں اور ہندوستانی بولیوں کے لیے معیار کی برتری 70% تک پہنچ جاتی ہے۔ خاص طور پر تیار کردہ ڈیمو سائٹ پر ترجمے کے معیار کو بصری طور پر جانچنا ممکن ہے۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں