Facebook 200 భాషలకు మద్దతు ఇచ్చే యంత్ర అనువాద నమూనాను ప్రచురిస్తుంది

Facebook (రష్యన్ ఫెడరేషన్‌లో నిషేధించబడింది) NLLB (ఏ భాష మిగిలి లేదు) ప్రాజెక్ట్ యొక్క అభివృద్ధిని ప్రచురించింది, ఇది ఒక భాష నుండి మరొక భాషకు నేరుగా అనువదించడానికి ఒక యూనివర్సల్ మెషీన్ లెర్నింగ్ మోడల్‌ను రూపొందించే లక్ష్యంతో, ఇంటర్మీడియట్ అనువాదాన్ని ఆంగ్లంలోకి దాటవేస్తుంది. ప్రతిపాదిత నమూనా ఆఫ్రికన్ మరియు ఆస్ట్రేలియన్ ప్రజల అరుదైన భాషలతో సహా 200 కంటే ఎక్కువ భాషలను కవర్ చేస్తుంది. ప్రాజెక్ట్ యొక్క అంతిమ లక్ష్యం వారు మాట్లాడే భాషతో సంబంధం లేకుండా ఏ వ్యక్తులకైనా కమ్యూనికేషన్ కోసం ఒక మార్గాన్ని అందించడం.

మోడల్ క్రియేటివ్ కామన్స్ BY-NC 4.0 లైసెన్స్ క్రింద లైసెన్స్ పొందింది, ఇది కాపీ చేయడం, పునఃపంపిణీ చేయడం, అనుకూలీకరణ చేయడం మరియు ఉత్పన్నమైన పనులను అనుమతించడం, మీరు అట్రిబ్యూషన్ ఇవ్వడం, లైసెన్స్‌ను నిర్వహించడం మరియు వాణిజ్యేతర ప్రయోజనాల కోసం మాత్రమే ఉపయోగించడం వంటివి చేయవచ్చు. మోడళ్లతో పని చేసే సాధనాలు MIT లైసెన్స్ క్రింద అందించబడ్డాయి. NLLB నమూనాను ఉపయోగించి అభివృద్ధిని ఉత్తేజపరిచేందుకు, పరిశోధకులకు గ్రాంట్లు అందించడానికి $200 వేలను కేటాయించాలని నిర్ణయించారు.

ప్రతిపాదిత నమూనాను ఉపయోగించి ప్రాజెక్ట్‌ల సృష్టిని సరళీకృతం చేయడానికి, నమూనాల నాణ్యతను పరీక్షించడానికి మరియు అంచనా వేయడానికి ఉపయోగించే అప్లికేషన్‌ల కోడ్ (FLORES-200, NLLB-MD, టాక్సిసిటీ-200), LASER3 లైబ్రరీ ఆధారంగా శిక్షణ నమూనాలు మరియు ఎన్‌కోడర్‌ల కోసం కోడ్ ( భాష-అజ్ఞేయ వాక్యం) అదనంగా ఓపెన్ సోర్స్. ప్రాతినిధ్యం). చివరి మోడల్ రెండు వెర్షన్లలో అందించబడుతుంది - పూర్తి మరియు కుదించబడింది. సంక్షిప్త సంస్కరణకు తక్కువ వనరులు అవసరం మరియు పరిశోధన ప్రాజెక్ట్‌లలో పరీక్షించడానికి మరియు ఉపయోగించడానికి అనుకూలంగా ఉంటుంది.

మెషీన్ లెర్నింగ్ సిస్టమ్‌లపై ఆధారపడిన ఇతర అనువాద వ్యవస్థల వలె కాకుండా, Facebook యొక్క పరిష్కారం గుర్తించదగినది, ఇది అన్ని 200 భాషలకు ఒక సాధారణ నమూనాను అందిస్తుంది, అన్ని భాషలను కవర్ చేస్తుంది మరియు ప్రతి భాషకు ప్రత్యేక నమూనాలను ఉపయోగించాల్సిన అవసరం లేదు. ఆంగ్లంలోకి ఇంటర్మీడియట్ అనువాదం లేకుండా నేరుగా మూల భాష నుండి లక్ష్య భాషకు అనువాదం జరుగుతుంది. సార్వత్రిక అనువాద వ్యవస్థలను రూపొందించడానికి, LID మోడల్ (భాషా గుర్తింపు) అదనంగా ప్రతిపాదించబడింది, ఇది ఉపయోగించిన భాషను గుర్తించడం సాధ్యం చేస్తుంది. ఆ. సమాచారం ఏ భాషలో అందించబడిందో సిస్టమ్ స్వయంచాలకంగా గుర్తించగలదు మరియు దానిని వినియోగదారు భాషలోకి అనువదిస్తుంది.

మద్దతు ఉన్న 200 భాషల్లో దేని మధ్య అయినా అనువాదం ఏ దిశలోనైనా మద్దతు ఇస్తుంది. ఏదైనా భాషల మధ్య అనువాద నాణ్యతను నిర్ధారించడానికి, FLORES-200 రిఫరెన్స్ టెస్ట్ సెట్ తయారు చేయబడింది, అనువాద నాణ్యత పరంగా NLLB-200 మోడల్ గతంలో ప్రతిపాదించిన మెషీన్ లెర్నింగ్-ఆధారిత పరిశోధనా వ్యవస్థల కంటే సగటున 44% ఉన్నతమైనదని ఇది చూపించింది. యంత్ర అనువాదాన్ని ప్రామాణిక మానవ అనువాదంతో పోల్చిన BLEU కొలమానాలు. అరుదైన ఆఫ్రికన్ భాషలు మరియు భారతీయ మాండలికాల కోసం, నాణ్యత ఆధిపత్యం 70% కి చేరుకుంటుంది. ప్రత్యేకంగా తయారు చేయబడిన డెమో సైట్‌లో అనువాద నాణ్యతను దృశ్యమానంగా అంచనా వేయడం సాధ్యమవుతుంది.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి