అమెజాన్ 51 భాషల్లో ప్రసంగాన్ని అర్థం చేసుకోవడానికి డేటాసెట్‌ను ప్రచురించింది

Amazon CC BY 4.0 లైసెన్స్ క్రింద "MASSIVE" (స్లాట్ ఫిల్లింగ్, ఇంటెంట్ క్లాసిఫికేషన్ మరియు వర్చువల్-అసిస్టెంట్ ఎవాల్యుయేషన్ కోసం బహుభాషా అమెజాన్ SLURP) డేటాసెట్, మెషీన్ లెర్నింగ్ సిస్టమ్‌ల కోసం నమూనాలు మరియు మీ స్వంత మోడల్‌లకు శిక్షణ ఇచ్చే సాధనాలను ప్రచురించింది. సహజ భాషపై సమాచారాన్ని అర్థం చేసుకోండి (NLU, సహజ భాషా అవగాహన). సెట్‌లో 51 భాషల కోసం సిద్ధం చేయబడిన మిలియన్ కంటే ఎక్కువ ఉల్లేఖన మరియు వర్గీకృత వచన ఉచ్చారణలు ఉన్నాయి.

SLURP సేకరణ, వాస్తవానికి ఆంగ్లంలో అందుబాటులో ఉంది, ఇది భారీ సెట్‌ను నిర్మించడానికి సూచనగా ఉపయోగించబడింది, ఇది ప్రొఫెషనల్ అనువాదకులను ఉపయోగించి 50 ఇతర భాషలలోకి స్థానీకరించబడింది. అలెక్సా యొక్క సహజ భాషా అవగాహన (NLU) సాంకేతికత మొదట ప్రసంగాన్ని టెక్స్ట్‌గా మారుస్తుంది, ఆపై వినియోగదారు ప్రశ్న యొక్క సారాంశాన్ని గుర్తించడానికి కీలకపదాల ఉనికిని విశ్లేషించే టెక్స్ట్‌కు బహుళ NLU నమూనాలను వర్తింపజేస్తుంది.

ఒకేసారి అనేక భాషల్లో సమాచారాన్ని ప్రాసెస్ చేయడానికి వాయిస్ అసిస్టెంట్‌లను స్వీకరించడం, అలాగే వాయిస్ అసిస్టెంట్ల సామర్థ్యాలను విస్తరించే అప్లికేషన్‌లు మరియు సేవలను రూపొందించడానికి మూడవ పక్ష డెవలపర్‌లను ప్రోత్సహించడం సెట్‌ను రూపొందించడం మరియు ప్రచురించడం యొక్క లక్ష్యాలలో ఒకటి. డెవలపర్‌ల దృష్టిని ఆకర్షించడానికి, ప్రచురించిన డేటాసెట్‌ని ఉపయోగించి అత్యుత్తమ జెనరిక్ మోడల్‌ను రూపొందించడానికి అమెజాన్ పోటీని ప్రారంభించింది.

ప్రస్తుతం, వాయిస్ అసిస్టెంట్లు కొన్ని భాషలకు మాత్రమే మద్దతిస్తున్నారు మరియు నిర్దిష్ట భాషతో ముడిపడి ఉన్న యంత్ర అభ్యాస నమూనాలను ఉపయోగిస్తున్నారు. MASSIVE ప్రాజెక్ట్ వివిధ భాషలలో సమాచారాన్ని అన్వయించగల మరియు ప్రాసెస్ చేయగల సార్వత్రిక నమూనాలు మరియు యంత్ర అభ్యాస వ్యవస్థలను సృష్టించడం ద్వారా ఈ లోపాన్ని తొలగించడం లక్ష్యంగా పెట్టుకుంది.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి