IBM దాని కోడ్నెట్ చొరవను ఆవిష్కరించింది, ఇది ప్రోగ్రామింగ్ లాంగ్వేజ్ ట్రాన్స్లేటర్లు, కోడ్ జనరేటర్లు మరియు ఎనలైజర్లను రూపొందించడానికి మెషిన్ లెర్నింగ్ టెక్నిక్లను ఉపయోగించి ప్రయోగాలు చేయడానికి అనుమతించే డేటాసెట్ను పరిశోధకులకు అందించడం లక్ష్యంగా పెట్టుకుంది. కోడ్నెట్ 14 సాధారణ ప్రోగ్రామింగ్ సమస్యలను పరిష్కరించే 4053 మిలియన్ కోడ్ ఉదాహరణల సేకరణను కలిగి ఉంది. మొత్తంగా, సేకరణలో సుమారు 500 మిలియన్ లైన్ల కోడ్ ఉంది మరియు 55 ప్రోగ్రామింగ్ భాషలను కవర్ చేస్తుంది, C++, Java, Python మరియు Go వంటి ఆధునిక భాషలు మరియు COBOL, Pascal మరియు FORTRANతో సహా లెగసీ భాషలు. ప్రాజెక్ట్ యొక్క డెవలప్మెంట్లు Apache 2.0 లైసెన్స్ క్రింద పంపిణీ చేయబడ్డాయి మరియు డేటా సెట్లను పబ్లిక్ డొమైన్ రూపంలో పంపిణీ చేయడానికి ప్లాన్ చేయబడింది.
ఉదాహరణలు ఉల్లేఖించబడ్డాయి మరియు వివిధ ప్రోగ్రామింగ్ భాషలలో ఒకే విధమైన అల్గారిథమ్లను అమలు చేస్తాయి. ప్రతిపాదిత సెట్ మెషీన్ లెర్నింగ్ సిస్టమ్లకు శిక్షణ ఇవ్వడానికి మరియు అనువాదం మరియు మెషిన్ కోడ్ పార్సింగ్ రంగంలో ఆవిష్కరణలను అభివృద్ధి చేయడంలో సహాయపడుతుందని అంచనా వేయబడింది, ఇమేజ్ నెట్ ఉల్లేఖన ఇమేజ్ డేటాబేస్ నమూనా గుర్తింపు మరియు కంప్యూటర్ విజన్ సిస్టమ్ల అభివృద్ధికి ఎలా సహాయపడిందో అదే విధంగా. వివిధ ప్రోగ్రామింగ్ పోటీలు సేకరణ ఏర్పడటానికి ప్రధాన వనరులలో ఒకటిగా పేర్కొనబడ్డాయి.
అనువాద నియమాల ఆధారంగా అమలు చేయబడిన సాంప్రదాయ అనువాదకుల వలె కాకుండా, మెషీన్ లెర్నింగ్ సిస్టమ్లు కోడ్ ఉపయోగం యొక్క సందర్భాన్ని సంగ్రహించగలవు మరియు పరిగణనలోకి తీసుకోగలవు. ఒక ప్రోగ్రామింగ్ భాష నుండి మరొక భాషకు మార్చేటప్పుడు, ఒక మానవ భాష నుండి మరొక భాషకు అనువదించేటప్పుడు సందర్భం కూడా అంతే ముఖ్యం. COBOL వంటి లెగసీ లాంగ్వేజ్ల నుండి కోడ్ని మార్చకుండా ఈ సందర్భాన్ని పరిగణనలోకి తీసుకోకపోవడం వల్లే నిరోధిస్తుంది.
వివిధ భాషలలో అల్గోరిథం అమలుల యొక్క పెద్ద డేటాబేస్ కలిగి ఉండటం సార్వత్రిక యంత్ర అభ్యాస వ్యవస్థలను రూపొందించడంలో సహాయపడుతుంది, నిర్దిష్ట భాషల మధ్య ప్రత్యక్ష అనువాదానికి బదులుగా, నిర్దిష్ట ప్రోగ్రామింగ్ భాషలతో సంబంధం లేకుండా కోడ్ యొక్క మరింత నైరూప్య ప్రాతినిధ్యాన్ని మార్చవచ్చు. అటువంటి వ్యవస్థను అనువాదకుడిగా ఉపయోగించవచ్చు, మద్దతు ఉన్న ఏదైనా భాషలో ప్రసారం చేయబడిన కోడ్ను దాని అంతర్గత నైరూప్య ప్రాతినిధ్యంలోకి అనువదిస్తుంది, దీని నుండి కోడ్ బహుళ భాషలలో రూపొందించబడుతుంది.
సిస్టమ్ ద్వి దిశాత్మక పరివర్తనలను కూడా చేయగలదు. ఉదాహరణకు, బ్యాంకులు మరియు ప్రభుత్వ ఏజెన్సీలు కాలం చెల్లిన COBOL భాషలో ప్రాజెక్ట్లను ఉపయోగించడం కొనసాగిస్తున్నాయి. మెషీన్ లెర్నింగ్-ఆధారిత అనువాదకుడు COBOL కోడ్ను జావా ప్రాతినిధ్యంగా మార్చగలడు మరియు అవసరమైతే, జావా భాగాన్ని తిరిగి COBOL కోడ్లోకి అనువదించగలడు.
భాషల మధ్య అనువాదంతో పాటు, స్మార్ట్ కోడ్ శోధన వ్యవస్థల సృష్టి మరియు క్లోన్ డిటెక్షన్ యొక్క ఆటోమేషన్, అలాగే ఆప్టిమైజర్లు మరియు ఆటోమేటిక్ కోడ్ కరెక్షన్ సిస్టమ్ల అభివృద్ధి వంటి కోడ్నెట్ అప్లికేషన్ యొక్క రంగాలు పేర్కొనబడ్డాయి. ప్రత్యేకించి, కోడ్నెట్లో అందించబడిన ఉదాహరణలు పనితీరు పరీక్ష ఫలితాలను వివరించే మెటాడేటాతో అమర్చబడి ఉంటాయి, ఫలితంగా ప్రోగ్రామ్ పరిమాణం, మెమరీ వినియోగం మరియు స్థితి, ఇది కోడ్ నుండి సరైన కోడ్ను దోషాలతో వేరు చేయడానికి అనుమతిస్తుంది (సరైన కోడ్ని తప్పు కోడ్ నుండి వేరు చేయడానికి, సేకరణలో ప్రత్యేకంగా లోపాలతో ఉదాహరణలు ఉన్నాయి, వీటిలో వాటా 29.5%). మెషీన్ లెర్నింగ్ సిస్టమ్ ఈ మెటాడేటాను అత్యంత అనుకూలమైన కోడ్ని రూపొందించడానికి లేదా విశ్లేషించబడిన కోడ్లో రిగ్రెషన్లను గుర్తించడానికి పరిగణనలోకి తీసుకోవచ్చు (సమర్పించబడిన కోడ్లోని అల్గారిథమ్ సరైన రీతిలో అమలు చేయబడలేదని లేదా లోపాలను కలిగి ఉందని సిస్టమ్ అర్థం చేసుకోగలదు).
మూలం: opennet.ru