Yandex రెసిడెంట్ ప్రోగ్రామ్, లేదా ఒక అనుభవజ్ఞుడైన బ్యాకెండర్ ఎలా ML ఇంజనీర్ కావచ్చు

Yandex రెసిడెంట్ ప్రోగ్రామ్, లేదా ఒక అనుభవజ్ఞుడైన బ్యాకెండర్ ఎలా ML ఇంజనీర్ కావచ్చు

Yandex అనుభవజ్ఞులైన బ్యాకెండ్ డెవలపర్‌ల కోసం మెషిన్ లెర్నింగ్‌లో రెసిడెన్సీ ప్రోగ్రామ్‌ను తెరుస్తోంది. మీరు C++/Pythonలో చాలా వ్రాసి, MLకి ఈ పరిజ్ఞానాన్ని వర్తింపజేయాలనుకుంటే, మేము మీకు ప్రాక్టికల్ రీసెర్చ్ ఎలా చేయాలో నేర్పిస్తాము మరియు అనుభవజ్ఞులైన సలహాదారులను అందిస్తాము. మీరు కీలకమైన Yandex సేవలపై పని చేస్తారు మరియు లీనియర్ మోడల్‌లు మరియు గ్రేడియంట్ బూస్టింగ్, రికమండేషన్ సిస్టమ్‌లు, ఇమేజ్‌లు, టెక్స్ట్ మరియు సౌండ్‌ని విశ్లేషించడానికి న్యూరల్ నెట్‌వర్క్‌లు వంటి అంశాలలో నైపుణ్యాలను పొందుతారు. ఆఫ్‌లైన్ మరియు ఆన్‌లైన్‌లో కొలమానాలను ఉపయోగించి మీ మోడల్‌లను ఎలా సరిగ్గా మూల్యాంకనం చేయాలో కూడా మీరు నేర్చుకుంటారు.

కార్యక్రమం యొక్క వ్యవధి ఒక సంవత్సరం, ఈ సమయంలో పాల్గొనేవారు Yandex యొక్క మెషిన్ ఇంటెలిజెన్స్ మరియు పరిశోధన విభాగంలో పని చేస్తారు, అలాగే ఉపన్యాసాలు మరియు సెమినార్లకు హాజరవుతారు. పాల్గొనడం చెల్లించబడుతుంది మరియు పూర్తి సమయం పనిని కలిగి ఉంటుంది: ఈ సంవత్సరం జూలై 40 నుండి వారానికి 1 గంటలు. అప్లికేషన్లు ఇప్పుడు తెరవబడ్డాయి మరియు మే 1 వరకు కొనసాగుతుంది. 

మరియు ఇప్పుడు మరింత వివరంగా - మేము ఎలాంటి ప్రేక్షకుల కోసం ఎదురు చూస్తున్నాము, పని ప్రక్రియ ఎలా ఉంటుంది మరియు సాధారణంగా, బ్యాక్ ఎండ్ స్పెషలిస్ట్ MLలో వృత్తికి ఎలా మారవచ్చు.

దృష్టి

చాలా కంపెనీలు రెసిడెన్సీ ప్రోగ్రామ్‌లను కలిగి ఉన్నాయి, ఉదాహరణకు, Google మరియు Facebook. వారు ప్రధానంగా ML పరిశోధన వైపు అడుగు వేయడానికి ప్రయత్నిస్తున్న జూనియర్ మరియు మధ్య-స్థాయి నిపుణులను లక్ష్యంగా చేసుకున్నారు. మా కార్యక్రమం వేరే ప్రేక్షకుల కోసం. పారిశ్రామిక మెషీన్ లెర్నింగ్ సమస్యలను పరిష్కరించడంలో సైంటిస్ట్ నైపుణ్యాలను కాదు - ఆచరణాత్మక నైపుణ్యాలను పొందేందుకు - ఇప్పటికే తగినంత అనుభవాన్ని పొంది, వారి సామర్థ్యాలలో ML వైపు మళ్లాలని ఖచ్చితంగా తెలిసిన బ్యాకెండ్ డెవలపర్‌లను మేము ఆహ్వానిస్తున్నాము. మేము యువ పరిశోధకులకు మద్దతు ఇవ్వడం లేదని దీని అర్థం కాదు. మేము వారి కోసం ప్రత్యేక కార్యక్రమాన్ని నిర్వహించాము - ప్రీమియం ఇలియా సెగలోవిచ్ పేరు పెట్టబడింది, ఇది Yandexలో పని చేయడానికి మిమ్మల్ని అనుమతిస్తుంది.

నివాసి ఎక్కడ పని చేస్తాడు?

మెషిన్ ఇంటెలిజెన్స్ అండ్ రీసెర్చ్ విభాగంలో, మనమే ప్రాజెక్ట్ ఆలోచనలను అభివృద్ధి చేస్తాము. ప్రేరణ యొక్క ప్రధాన మూలం శాస్త్రీయ సాహిత్యం, వ్యాసాలు మరియు పరిశోధనా సంఘంలోని పోకడలు. నా సహోద్యోగులు మరియు నేను మేము చదివిన వాటిని విశ్లేషిస్తాము, శాస్త్రవేత్తలు ప్రతిపాదించిన పద్ధతులను ఎలా మెరుగుపరచవచ్చు లేదా విస్తరించవచ్చు అనేదానిని పరిశీలిస్తాము. అదే సమయంలో, మనలో ప్రతి ఒక్కరూ అతని జ్ఞానం మరియు ఆసక్తుల ప్రాంతాన్ని పరిగణనలోకి తీసుకుంటారు, అతను ముఖ్యమైనదిగా భావించే ప్రాంతాల ఆధారంగా పనిని రూపొందిస్తారు. ప్రాజెక్ట్ కోసం ఆలోచన సాధారణంగా బాహ్య పరిశోధన ఫలితాలు మరియు ఒకరి స్వంత సామర్థ్యాల ఖండన వద్ద పుడుతుంది.

ఈ వ్యవస్థ మంచిది ఎందుకంటే ఇది యాండెక్స్ సేవల యొక్క సాంకేతిక సమస్యలను ఉత్పన్నమయ్యే ముందు కూడా పరిష్కరిస్తుంది. సేవ సమస్యను ఎదుర్కొన్నప్పుడు, దాని ప్రతినిధులు మా వద్దకు వస్తారు, మేము ఇప్పటికే సిద్ధం చేసిన సాంకేతికతలను తీసుకునే అవకాశం ఉంది, ఉత్పత్తిలో సరిగ్గా వర్తింపజేయడం మాత్రమే మిగిలి ఉంది. ఏదైనా సిద్ధంగా లేకుంటే, మనం ఎక్కడ “త్రవ్వడం ప్రారంభించవచ్చు” మరియు ఏ కథనాలలో పరిష్కారం కోసం వెతకాలో కనీసం త్వరగా గుర్తుంచుకుంటాము. మనకు తెలిసినట్లుగా, దిగ్గజాల భుజాలపై నిలబడటం శాస్త్రీయ విధానం.

ఏం చేయాలి

Yandex వద్ద - మరియు ప్రత్యేకంగా మా నిర్వహణలో కూడా - ML యొక్క అన్ని సంబంధిత ప్రాంతాలు అభివృద్ధి చేయబడుతున్నాయి. అనేక రకాల ఉత్పత్తుల నాణ్యతను మెరుగుపరచడం మా లక్ష్యం, మరియు ఇది కొత్తదంతా పరీక్షించడానికి ప్రోత్సాహకంగా పనిచేస్తుంది. అదనంగా, కొత్త సేవలు క్రమం తప్పకుండా కనిపిస్తాయి. కాబట్టి లెక్చర్ ప్రోగ్రామ్ పారిశ్రామిక అభివృద్ధిలో మెషిన్ లెర్నింగ్ యొక్క అన్ని కీలకమైన (బాగా నిరూపించబడిన) ప్రాంతాలను కలిగి ఉంటుంది. కోర్సులో నా భాగాన్ని కంపైల్ చేస్తున్నప్పుడు, నేను స్కూల్ ఆఫ్ డేటా అనాలిసిస్‌లో నా బోధనా అనుభవాన్ని, అలాగే ఇతర SHAD ఉపాధ్యాయుల మెటీరియల్‌లు మరియు పనిని ఉపయోగించాను. నా సహోద్యోగులు కూడా అలాగే చేశారని నాకు తెలుసు.

మొదటి నెలల్లో, కోర్సు ప్రోగ్రామ్ ప్రకారం శిక్షణ మీ పని సమయంలో సుమారు 30%, తర్వాత 10% ఉంటుంది. అయినప్పటికీ, ML మోడల్‌లతో పనిచేయడం అనేది అన్ని అనుబంధ ప్రక్రియల కంటే దాదాపు నాలుగు రెట్లు తక్కువ తీసుకుంటుందని అర్థం చేసుకోవడం ముఖ్యం. వీటిలో బ్యాకెండ్‌ను సిద్ధం చేయడం, డేటాను స్వీకరించడం, ప్రీప్రాసెసింగ్ కోసం పైప్‌లైన్ రాయడం, కోడ్‌ను ఆప్టిమైజ్ చేయడం, నిర్దిష్ట హార్డ్‌వేర్‌కు అనుగుణంగా మార్చడం మొదలైనవి ఉన్నాయి. ML ఇంజనీర్ మీకు కావాలనుకుంటే పూర్తి-స్టాక్ డెవలపర్ (మెషిన్ లెర్నింగ్‌పై ఎక్కువ ప్రాధాన్యతతో మాత్రమే) , ప్రారంభం నుండి ముగింపు వరకు సమస్యను పరిష్కరించగల సామర్థ్యం. రెడీమేడ్ మోడల్‌తో కూడా, మీరు బహుశా అనేక చర్యలను చేయాల్సి ఉంటుంది: అనేక మెషీన్‌లలో దాని అమలును సమాంతరంగా చేయండి, హ్యాండిల్, లైబ్రరీ లేదా సేవ యొక్క భాగాల రూపంలో అమలును సిద్ధం చేయండి.

విద్యార్థి ఎంపిక
మీరు మొదట బ్యాకెండ్ డెవలపర్‌గా పని చేయడం ద్వారా ML ఇంజనీర్ కావడమే మంచిదనే భావనలో ఉంటే, ఇది నిజం కాదు. సేవలను అభివృద్ధి చేయడం, నేర్చుకోవడం మరియు మార్కెట్‌లో విపరీతమైన డిమాండ్‌ను పొందడంలో నిజమైన అనుభవం లేకుండా అదే ShADలో నమోదు చేసుకోవడం ఒక అద్భుతమైన ఎంపిక. చాలా మంది Yandex నిపుణులు వారి ప్రస్తుత స్థానాల్లో ఈ విధంగా ముగించారు. గ్రాడ్యుయేషన్ పూర్తయిన వెంటనే మీకు ML రంగంలో ఉద్యోగాన్ని అందించడానికి ఏదైనా కంపెనీ సిద్ధంగా ఉంటే, మీరు బహుశా ఆఫర్‌ను కూడా అంగీకరించాలి. అనుభవజ్ఞుడైన మెంటార్‌తో మంచి టీమ్‌లోకి ప్రవేశించడానికి ప్రయత్నించండి మరియు చాలా నేర్చుకోవడానికి సిద్ధంగా ఉండండి.

ML చేయకుండా సాధారణంగా ఏది నిరోధిస్తుంది?

ఒక బ్యాకెండర్ ML ఇంజనీర్ కావాలని కోరుకుంటే, అతను రెసిడెన్సీ ప్రోగ్రామ్‌ను పరిగణనలోకి తీసుకోకుండా రెండు అభివృద్ధి రంగాలను ఎంచుకోవచ్చు.

మొదట, కొన్ని విద్యా కోర్సులో భాగంగా అధ్యయనం చేయండి. పాఠాలు కోర్సెరా ప్రాథమిక పద్ధతులను అర్థం చేసుకోవడానికి మిమ్మల్ని దగ్గర చేస్తుంది, కానీ తగినంత మేరకు వృత్తిలో మునిగిపోవడానికి, మీరు దానికి ఎక్కువ సమయం కేటాయించాలి. ఉదాహరణకు, ShAD నుండి గ్రాడ్యుయేట్. సంవత్సరాలుగా, ShAD నేరుగా మెషిన్ లెర్నింగ్‌పై విభిన్న సంఖ్యలో కోర్సులను కలిగి ఉంది - సగటున, సుమారు ఎనిమిది. గ్రాడ్యుయేట్ల అభిప్రాయంతో సహా వాటిలో ప్రతి ఒక్కటి నిజంగా ముఖ్యమైనది మరియు ఉపయోగకరంగా ఉంటుంది. 

రెండవది, మీరు ఒకటి లేదా మరొక ML అల్గారిథమ్‌ను అమలు చేయాల్సిన పోరాట ప్రాజెక్టులలో మీరు పాల్గొనవచ్చు. అయితే, IT డెవలప్‌మెంట్ మార్కెట్‌లో చాలా తక్కువ ప్రాజెక్టులు ఉన్నాయి: చాలా పనులలో మెషిన్ లెర్నింగ్ ఉపయోగించబడదు. ML-సంబంధిత అవకాశాలను చురుగ్గా అన్వేషిస్తున్న బ్యాంకుల్లో కూడా, కొంతమంది మాత్రమే డేటా విశ్లేషణలో నిమగ్నమై ఉన్నారు. మీరు ఈ టీమ్‌లలో ఒకదానిలో చేరలేకపోతే, మీ స్వంత ప్రాజెక్ట్‌ను ప్రారంభించడం మాత్రమే మీ ఏకైక ఎంపిక (ఎక్కడ ఎక్కువగా, మీరు మీ స్వంత గడువులను సెట్ చేసుకుంటారు మరియు దీనికి పోరాట ఉత్పత్తి పనులతో పెద్దగా సంబంధం లేదు) లేదా పోటీ చేయడం ప్రారంభించండి కాగ్లే.

నిజానికి, ఇతర కమ్యూనిటీ సభ్యులతో జట్టుకట్టండి మరియు పోటీలలో మీరే ప్రయత్నించండి సాపేక్షంగా సులభం - ప్రత్యేకంగా మీరు శిక్షణ మరియు కోర్సెరాలో పేర్కొన్న కోర్సులతో మీ నైపుణ్యాలను బ్యాకప్ చేస్తే. ప్రతి పోటీకి గడువు ఉంటుంది - ఇది మీకు ప్రోత్సాహకంగా ఉపయోగపడుతుంది మరియు IT కంపెనీలలో ఇలాంటి వ్యవస్థ కోసం మిమ్మల్ని సిద్ధం చేస్తుంది. ఇది మంచి మార్గం - ఏది ఏమైనప్పటికీ, నిజమైన ప్రక్రియల నుండి కొద్దిగా విడాకులు తీసుకోబడింది. Kaggleలో మీకు ముందుగా ప్రాసెస్ చేయబడినవి అందించబడతాయి, అయితే ఎల్లప్పుడూ ఖచ్చితమైనవి కానప్పటికీ, డేటా; ఉత్పత్తికి సహకారం గురించి ఆలోచించడానికి ఆఫర్ చేయవద్దు; మరియు ముఖ్యంగా, వారికి ఉత్పత్తికి తగిన పరిష్కారాలు అవసరం లేదు. మీ అల్గారిథమ్‌లు బహుశా పని చేస్తాయి మరియు చాలా ఖచ్చితమైనవిగా ఉంటాయి, కానీ మీ మోడల్‌లు మరియు కోడ్ ఫ్రాంకెన్‌స్టైయిన్ వివిధ భాగాల నుండి కుట్టినట్లుగా ఉంటాయి - ఉత్పత్తి ప్రాజెక్ట్‌లో, మొత్తం నిర్మాణం చాలా నెమ్మదిగా పని చేస్తుంది, నవీకరించడం మరియు విస్తరించడం కష్టం (ఉదాహరణకు, భాష అభివృద్ధి చెందుతున్నప్పుడు భాష మరియు వాయిస్ అల్గారిథమ్‌లు ఎల్లప్పుడూ పాక్షికంగా తిరిగి వ్రాయబడతాయి). జాబితా చేయబడిన పని మీ ద్వారా మాత్రమే కాకుండా (పరిష్కార రచయితగా మీరు దీన్ని చేయగలరని స్పష్టమవుతుంది), కానీ మీ సహోద్యోగులలో ఎవరైనా కూడా చేయవచ్చని కంపెనీలు ఆసక్తి కలిగి ఉన్నాయి. క్రీడలు మరియు పారిశ్రామిక ప్రోగ్రామింగ్ మధ్య వ్యత్యాసం చర్చించబడింది много, మరియు కాగ్లే ఖచ్చితంగా “అథ్లెట్లకు” అవగాహన కల్పిస్తాడు - అది చాలా బాగా చేసినప్పటికీ, వారు కొంత అనుభవాన్ని పొందేలా చేస్తుంది.

నేను రెండు సాధ్యమైన అభివృద్ధి మార్గాలను వివరించాను - విద్యా కార్యక్రమాల ద్వారా శిక్షణ మరియు "యుద్ధంలో" శిక్షణ, ఉదాహరణకు కాగ్లేలో. రెసిడెన్సీ ప్రోగ్రామ్ ఈ రెండు పద్ధతుల కలయిక. ShAD స్థాయిలో ఉపన్యాసాలు మరియు సెమినార్‌లు, అలాగే నిజమైన పోరాట ప్రాజెక్ట్‌లు మీ కోసం వేచి ఉన్నాయి.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి