குறிப்புகள் தேதி விஞ்ஞானி: எங்கு தொடங்குவது மற்றும் அது அவசியமா?

குறிப்புகள் தேதி விஞ்ஞானி: எங்கு தொடங்குவது மற்றும் அது அவசியமா?

TL;DR என்பது டேட்டா சயின்ஸ் பற்றிய கேள்விகள்/பதில்களுக்கான இடுகை மற்றும் தொழிலில் நுழைந்து அதில் எவ்வாறு முன்னேறுவது. கட்டுரையில் நான் அடிப்படைக் கொள்கைகள் மற்றும் அடிக்கடி கேட்கப்படும் கேள்விகளை பகுப்பாய்வு செய்வேன் மற்றும் உங்கள் குறிப்பிட்ட கேள்விகளுக்கு பதிலளிக்க தயாராக இருக்கிறேன் - கருத்துகளில் (அல்லது ஒரு தனிப்பட்ட செய்தியில்) எழுதுங்கள், சில நாட்களுக்குள் எல்லாவற்றிற்கும் பதிலளிக்க முயற்சிப்பேன்.

“சாத்தானிய தேதி” தொடர் குறிப்புகளின் வருகையுடன், பல செய்திகள் மற்றும் கருத்துகள் எவ்வாறு தொடங்குவது, எங்கு தோண்டுவது என்பது பற்றிய கேள்விகளுடன் வந்தன, இன்று வெளியீடுகளுக்குப் பிறகு எழுந்த முக்கிய திறன்கள் மற்றும் கேள்விகளை பகுப்பாய்வு செய்வோம்.

இங்கே கூறப்பட்ட அனைத்தும் இறுதி உண்மை என்று கூறவில்லை மற்றும் ஆசிரியரின் அகநிலை கருத்து. செயல்பாட்டில் மிக முக்கியமானதாகத் தோன்றும் முக்கிய விஷயங்களைப் பார்ப்போம்.

இது ஏன் சரியாக தேவைப்படுகிறது?

இலக்கு சிறப்பாக அடையக்கூடியதாக இருக்க, அது ஓரளவு குறிப்பிட்டதாகத் தோன்றும் வகையில் - நீங்கள் Facebook/Apple/Amazon/Netflix/Google இல் DS அல்லது ஆராய்ச்சி விஞ்ஞானி ஆக விரும்புகிறீர்கள் - தேவைகள், மொழிகள் மற்றும் தேவையான திறன்களைப் பாருங்கள். குறிப்பாக எந்த பதவிக்கு. பணியமர்த்தல் செயல்முறை என்ன? அத்தகைய பாத்திரத்தில் ஒரு பொதுவான நாள் எவ்வாறு செல்கிறது? அங்கு பணிபுரியும் நபரின் சராசரி சுயவிவரம் எப்படி இருக்கும்?

பெரும்பாலும் ஒட்டுமொத்த படம் என்னவென்றால், ஒரு நபருக்கு அவர் என்ன விரும்புகிறார் என்பது உண்மையில் புரியவில்லை, மேலும் இந்த தெளிவற்ற படத்தை எவ்வாறு தயாரிப்பது என்பது தெளிவாகத் தெரியவில்லை - எனவே நீங்கள் சரியாக என்ன விரும்புகிறீர்கள் என்பதற்கான தோராயமான திட்டத்தையாவது வைத்திருப்பது மதிப்பு.

தற்போதைய இலக்கு பார்வையை உறுதிப்படுத்தவும்

அது வழியில் மாறினாலும், நாடகத்தின் போது திட்டங்களை மாற்றுவது பொதுவாக இயல்பானதாக இருந்தாலும், ஒரு இலக்கை வைத்திருப்பது மற்றும் அதில் கவனம் செலுத்துவது, அவ்வப்போது மதிப்பீடு செய்வது மற்றும் மறுபரிசீலனை செய்வது மதிப்பு.

அது இருக்குமா அல்லது இன்னும் பொருத்தமானதா?

நீங்கள் ஒரு நிலைக்கு வளரும் நேரத்தில்.

உங்கள் பதவிக்கு முன் நீங்கள் பிஎச்டி பெற வேண்டும், 2-3 ஆண்டுகள் தொழில்துறையில் வேலை செய்ய வேண்டும், பொதுவாக மடாலயத்தில் தியானம் செய்யும்போது உங்கள் தலைமுடியை வெட்ட வேண்டும் என்று கற்பனை செய்து பாருங்கள் - தரவு அறிவியலின் நிலைமை ஒரு காலத்தில் பொருளாதார வல்லுநர்கள் மற்றும் வழக்கறிஞர்களா? நீங்கள் தொடர விரும்பும் பகுதியில் எல்லாம் அங்கீகாரத்திற்கு அப்பால் மாறுமா?

எல்லோரும் இப்போது அங்கு விரைந்து செல்வதற்கு நல்ல வாய்ப்பு இல்லையா, தொழிலில் நுழைய முயற்சிக்கும் பரந்த அடுக்கு மக்கள் இருக்கும் ஒரு படத்தைப் பார்ப்போம் - மேலும் ஒரு அற்பமான தொடக்க நிலை இருக்கும்.

ஒரு பாதையைத் தேர்ந்தெடுக்கும்போது தற்போதைய போக்குகளைக் கருத்தில் கொள்வது மதிப்புக்குரியதாக இருக்கலாம், தொழிலாளர் சந்தையின் தற்போதைய நிலை மட்டுமல்ல, அது எவ்வாறு மாறுகிறது, எங்கே உள்ளது என்பது பற்றிய உங்கள் யோசனையும் கூட.

எடுத்துக்காட்டாக, ஆசிரியர் சாத்தானியவாதியாக மாறத் திட்டமிடவில்லை, ஆனால் அவரது பிஎச்டியின் போது அவர் DS உடன் வலுவான திறன்களைக் கொண்ட மூன்றாம் தரப்பு திட்டங்களில் பணியாற்றினார், மேலும் பட்டதாரி பள்ளியின் முடிவில் அவர் இயற்கையாகவே சுற்றுச்சூழலுக்கு மாறினார், நல்லதைக் கண்டார். நிலை.

நாடகத்தின் போது வேறு எங்காவது நகர்த்த வேண்டியது அவசியம் என்று மாறிவிட்டால் - இப்போது அதிக இயக்கம் இருப்பதால், மிகவும் சுவாரஸ்யமான செயல்கள் அனைத்தும் நடக்கின்றன, நாங்கள் இயற்கையாகவே அங்கு செல்வோம்.

திறன் முறிவு

இவை DS இல் முழுமையான மற்றும் பயனுள்ள பணிக்கு முக்கியமாகத் தோன்றும் திறன்களின் நிபந்தனை வகைகளாகும். நான் தனித்தனியாக ஆங்கிலத்தை முன்னிலைப்படுத்துகிறேன் - CS இல் நீங்கள் என்ன செய்தாலும் கற்றுக்கொள்ளுங்கள். அடுத்தது முக்கிய வகைகள்.

நிரலாக்கம்/ஸ்கிரிப்டிங்

எந்தெந்த மொழிகளில் உங்களுக்கு நிச்சயமாகத் தெரியும்? மலைப்பாம்பு? ஜாவா? ஷெல் ஸ்கிரிப்டிங்? லுவா? SQL? சி++?

நிரலாக்கத்தின் அடிப்படையில் நீங்கள் சரியாக என்ன செய்ய வேண்டும் மற்றும் ஏன் - இங்கே நிலைகளின் வரம்பு பெரிதும் மாறுபடும்.

எடுத்துக்காட்டாக, நான் அடிக்கடி சிக்கலான தர்க்கம், வினவல்கள், மாதிரிகள், பகுப்பாய்வுகளை செயல்படுத்த வேண்டும் மற்றும் பொதுவாக விளக்கப்பட்ட அமைப்புகளை உருவாக்க வேண்டும், ஆனால் மிகவும் பொதுவான மற்றும் நியாயமானவை தவிர, குறியீட்டின் வேகத்திற்கான தேவைகள் இல்லை.

எனவே, டென்சர்ஃப்ளோ லைப்ரரியை எழுதுபவர்களிடமிருந்தும், எல்1 கேச் மற்றும் அதுபோன்ற விஷயங்களைத் திறம்பட பயன்படுத்துவதற்கான குறியீட்டை மேம்படுத்துவது பற்றிச் சிந்திப்பவர்களிடமிருந்தும் எனது திறன் தொகுப்பு மிகவும் வித்தியாசமானது, எனவே உங்களுக்குத் தேவையானவற்றைப் பார்த்து, கற்றலுக்கான சரியான பாதையை மதிப்பிடுங்கள்.

எடுத்துக்காட்டாக, பைத்தானைப் பொறுத்தவரை, மக்கள் ஏற்கனவே உருவாக்குகிறார்கள் ஒரு வரைபடம் மொழி கற்றல்.

நிச்சயமாக, உங்கள் தேவைகளுக்கு ஏற்கனவே அனுபவமிக்க ஆலோசனைகள் மற்றும் நல்ல ஆதாரங்கள் உள்ளன - நீங்கள் ஒரு பட்டியலைத் தீர்மானித்து அதைச் செய்யத் தொடங்க வேண்டும்.

வணிக செயல்முறைகளைப் புரிந்துகொள்வது

இது இல்லாமல் நீங்கள் எங்கும் செல்ல முடியாது: இந்த செயல்பாட்டில் நீங்கள் ஏன் தேவைப்படுகிறீர்கள், நீங்கள் என்ன செய்கிறீர்கள், ஏன் என்பதை நீங்கள் புரிந்து கொள்ள வேண்டும். பெரும்பாலும் இதுவே உங்களுக்கு நிறைய நேரத்தை மிச்சப்படுத்தலாம், உங்கள் நன்மைகளை அதிகப்படுத்தலாம் மற்றும் முட்டாள்தனத்தில் நேரத்தையும் வளங்களையும் வீணாக்காது.

பொதுவாக, பின்வரும் கேள்விகளை நானே கேட்டுக்கொள்கிறேன்:

  • நிறுவனத்தில் நான் சரியாக என்ன செய்வது?
  • ஏன்?
  • யார், எப்படி பயன்படுத்துவார்கள்?
  • எனக்கு என்ன விருப்பங்கள் உள்ளன?
  • அளவுருக்களின் வரம்புகள் என்ன?

அளவுருக்களைப் பற்றி இன்னும் கொஞ்சம் விவரம் இங்கே உள்ளது: ஏதாவது தியாகம் செய்யப்படலாம் என்று உங்களுக்குத் தெரிந்தால், நீங்கள் பெரும்பாலும் வேலை சூழ்நிலையை பெரிதும் மாற்றலாம்: எடுத்துக்காட்டாக, விளக்கம் அல்லது நேர்மாறாக, இரண்டு சதவிகிதம் இங்கே ஒரு பாத்திரத்தை வகிக்காது, மேலும் எங்களுக்கு மிக வேகமாக உள்ளது. தீர்வு, மற்றும் வாடிக்கையாளருக்கு அது தேவை, ஏனெனில் அவர் AWS இல் பைப்லைன் இயங்கும் நேரத்திற்கு பணம் செலுத்துகிறார்.

கணிதம்

இங்கே நீங்கள் எல்லாவற்றையும் நீங்களே சிந்தித்துப் புரிந்துகொள்கிறீர்கள் - அடிப்படைக் கணிதம் பற்றிய அறிவு இல்லாமல் நீங்கள் கையெறி குண்டு (மன்னிக்கவும் ரேண்டம் ஃபாரஸ்ட்) கொண்ட குரங்குகளைத் தவிர வேறில்லை - எனவே நீங்கள் குறைந்தபட்சம் அடிப்படை விஷயங்களைப் புரிந்து கொள்ள வேண்டும். நான் மிகக் குறைந்த பட்டியலைத் தொகுத்தால், அதில் பின்வருவன அடங்கும்:

  • நேரியல் இயற்கணிதம் - அதிக எண்ணிக்கையிலான ஆதாரங்கள் கூகிளுக்கு எளிதானது, உங்களுக்கு எது சிறந்தது என்பதைத் தேடுங்கள்;
  • கணித பகுப்பாய்வு - (குறைந்தது முதல் இரண்டு செமஸ்டர்களில்);
  • நிகழ்தகவு கோட்பாடு இயந்திர கற்றலில் எல்லா இடங்களிலும் உள்ளது;
  • காம்பினேட்டரிக்ஸ் - இது உண்மையில் கோட்பாட்டிற்குப் பூரணமானது;
  • வரைபடக் கோட்பாடு - குறைந்தபட்சம் அடிப்படை;
  • அல்காரிதம்கள் - குறைந்தது முதல் இரண்டு செமஸ்டர்களுக்கு (அவரது புத்தகத்தில் கோர்மனின் பரிந்துரைகளைப் பார்க்கவும்);
  • கணிதவியல் - குறைந்தபட்சம் அடிப்படை.

நடைமுறை தரவு பகுப்பாய்வு மற்றும் காட்சிப்படுத்தல்

மிக முக்கியமான விஷயங்களில் ஒன்று, தரவு மூலம் உங்கள் கைகளை அழுக்காகப் பெற பயப்படாமல் இருப்பது மற்றும் தரவுத்தொகுப்பு, திட்டம் மற்றும் விரைவான தரவு காட்சிப்படுத்தலை உருவாக்குவது பற்றிய விரிவான பகுப்பாய்வு நடத்துவது.

ஆய்வு தரவு பகுப்பாய்வு மற்ற எல்லா தரவு உருமாற்றங்கள் மற்றும் unix முனைகளில் இருந்து ஒரு எளிய பைப்லைனை உருவாக்கும் திறன் போன்ற இயற்கையான ஒன்றாக மாற வேண்டும் (முந்தைய கட்டுரைகளைப் பார்க்கவும்) அல்லது படிக்கக்கூடிய மற்றும் புரிந்துகொள்ளக்கூடிய நோட்புக்கை எழுதவும்.

நான் காட்சிப்படுத்தலைக் குறிப்பிட விரும்புகிறேன்: நூறு முறை கேட்பதை விட ஒரு முறை பார்ப்பது நல்லது.

ஒரு மேலாளருக்கு வரைபடத்தைக் காண்பிப்பது எண்களின் தொகுப்பை விட நூறு மடங்கு எளிதானது மற்றும் தெளிவானது, எனவே matplotlib, seaborn மற்றும் ggplot2 உங்கள் நண்பர்கள்.

மென் திறன்கள்

உங்கள் யோசனைகள், அத்துடன் முடிவுகள் மற்றும் கவலைகள் (முதலியன) மற்றவர்களுக்குத் தெரிவிப்பது சமமாக முக்கியமானது - நீங்கள் பணியை தொழில்நுட்ப மற்றும் வணிக அடிப்படையில் தெளிவாகக் கூற முடியும் என்பதை உறுதிப்படுத்திக் கொள்ளுங்கள்.

சக பணியாளர்கள், மேலாளர்கள், மேலதிகாரிகள், வாடிக்கையாளர்கள் மற்றும் தேவைப்படுபவர்களுக்கு என்ன நடக்கிறது, எந்தத் தரவைப் பயன்படுத்துகிறீர்கள் மற்றும் என்ன முடிவுகளைப் பெற்றீர்கள் என்பதை நீங்கள் விளக்கலாம்.

உங்கள் விளக்கப்படங்களும் ஆவணங்களும் நீங்கள் இல்லாமல் படிக்கப்பட வேண்டும். அதாவது, அங்கு எழுதப்பட்டதைப் புரிந்துகொள்ள நீங்கள் உங்களிடம் செல்ல வேண்டியதில்லை.

புள்ளியைப் பெறுவதற்கும்/அல்லது திட்டம்/உங்கள் வேலையை ஆவணப்படுத்துவதற்கும் தெளிவான விளக்கக்காட்சியை நீங்கள் செய்யலாம்.

உங்கள் நிலைப்பாட்டை நியாயமான மற்றும் உணர்ச்சியற்ற முறையில் தெரிவிக்கலாம், "ஆம்/இல்லை" அல்லது கேள்வி/முடிவை ஆதரிக்கலாம்.

பயிற்சி அமர்வுகள்

இதையெல்லாம் நீங்கள் கற்றுக்கொள்ளக்கூடிய பல இடங்கள் உள்ளன. நான் ஒரு சிறிய பட்டியலை தருகிறேன் - நான் அதிலிருந்து எல்லாவற்றையும் முயற்சித்தேன், உண்மையைச் சொல்வதானால், ஒவ்வொரு பொருளுக்கும் அதன் நன்மை தீமைகள் உள்ளன. இதை முயற்சிக்கவும், உங்களுக்கு எது பொருத்தமானது என்பதைத் தீர்மானிக்கவும், ஆனால் பல விருப்பங்களை முயற்சிக்கவும், ஒன்றில் சிக்கிக்கொள்ளாமல் இருக்கவும் நான் மிகவும் பரிந்துரைக்கிறேன்.

  • ஆன்லைன் படிப்புகள்: coursera, udacity, Edx, etc;
  • புதிய பள்ளிகள்: ஆன்லைன் மற்றும் ஆஃப்லைன் - SkillFactory, ShAD, MADE;
  • கிளாசிக்கல் பள்ளிகள்: பல்கலைக்கழக முதுநிலை திட்டங்கள் மற்றும் மேம்பட்ட பயிற்சி வகுப்புகள்;
  • திட்டங்கள் - உங்களுக்கு விருப்பமான பணிகளைத் தேர்ந்தெடுத்து அவற்றை வெட்டி, கிதுப்பில் பதிவேற்றலாம்;
  • இன்டர்ன்ஷிப்கள் - இங்கே எதையும் பரிந்துரைப்பது கடினம்; நீங்கள் கிடைக்கக்கூடியவற்றைப் பார்த்து பொருத்தமான விருப்பங்களைக் கண்டறிய வேண்டும்.

இது அவசியமா?

முடிவில், நானே பின்பற்ற முயற்சிக்கும் மூன்று தனிப்பட்ட கொள்கைகளைச் சேர்க்க விரும்புகிறேன்.

  • சுவாரஸ்யமாக இருக்க வேண்டும்;
  • உள் இன்பத்தைக் கொண்டு வாருங்கள் (= குறைந்த பட்சம் துன்பத்தை உண்டாக்காது);
  • "உன்னுடையதாக இருக்க வேண்டும்."

அவர்கள் ஏன்? ஒவ்வொரு நாளும் எதையாவது செய்து அதை ரசிக்காமல் அல்லது ஆர்வம் காட்டாமல் இருப்பதை கற்பனை செய்வது கடினம். நீங்கள் ஒரு மருத்துவர் மற்றும் மக்களுடன் தொடர்புகொள்வதை நீங்கள் வெறுக்கிறீர்கள் என்று கற்பனை செய்து பாருங்கள் - இது எப்படியாவது வேலை செய்ய முடியும், ஆனால் உங்களிடம் ஏதாவது கேட்க விரும்பும் நோயாளிகளின் ஓட்டத்தில் நீங்கள் தொடர்ந்து சங்கடமாக இருப்பீர்கள். இது நீண்ட காலத்திற்கு வேலை செய்யாது.

அக மகிழ்ச்சியை நான் ஏன் குறிப்பிட்டேன்? மேலும் வளர்ச்சிக்கும், கொள்கையளவில், கற்றல் செயல்முறைக்கும் இது அவசியம் என்று எனக்குத் தோன்றுகிறது. சில சிக்கலான அம்சங்களை நிறைவுசெய்து ஒரு மாதிரியை உருவாக்கும்போது அல்லது முக்கியமான அளவுருவைக் கணக்கிடும்போது நான் அதை மிகவும் ரசிக்கிறேன். எனது குறியீடு அழகாகவும் நன்றாகவும் எழுதப்பட்டிருக்கும் போது நான் அதை ரசிக்கிறேன். எனவே, புதிதாக ஒன்றைக் கற்றுக்கொள்வது சுவாரஸ்யமானது மற்றும் நேரடியாக குறிப்பிடத்தக்க உந்துதல் தேவையில்லை.

"உன்னுடையதாக இருத்தல்" என்பது தோராயமாக நீங்கள் செய்ய விரும்பிய அதே உணர்வு. என்னிடம் ஒரு சிறிய கதை உள்ளது. குழந்தை பருவத்திலிருந்தே, நான் ராக் இசையில் (மற்றும் உலோகம் - சால்மன்!) ஆர்வமாக இருந்தேன், மேலும் பலரைப் போலவே, நான் எப்படி விளையாடுவது என்பதைக் கற்றுக்கொள்ள விரும்பினேன், அவ்வளவுதான். எனக்கு செவிப்புலன் மற்றும் குரல் இல்லை என்று மாறியது - இது என்னைத் தொந்தரவு செய்யவில்லை (மேலும் இது மேடையில் பல கலைஞர்களைத் தொந்தரவு செய்யவில்லை என்று நான் சொல்ல வேண்டும்), நான் பள்ளியில் இருந்தபோது எனக்கு ஒரு கிட்டார் கிடைத்தது ... மணிக்கணக்கில் உட்கார்ந்து விளையாடுவது எனக்குப் பிடிக்கவில்லை என்பது தெளிவாகியது. அது கடினமாகப் போய்க் கொண்டிருந்தது, ஏதோ ஒருவித முட்டாள்தனம் வெளிவருவதாக எனக்கு எப்போதுமே தோன்றியது - அதிலிருந்து எனக்கு எந்த மகிழ்ச்சியும் கிடைக்கவில்லை, அசிங்கமாகவும், முட்டாள்தனமாகவும், முற்றிலும் இயலாமையாகவும் உணர்ந்தேன். நான் உண்மையில் வகுப்புகளுக்கு உட்காரும்படி என்னை கட்டாயப்படுத்தினேன், பொதுவாக அது குதிரைக்கு நல்ல உணவாக இல்லை.

அதே சமயம், ஃபிளாஷில் (அல்லது வேறு ஏதாவது) ஏதாவது ஒரு ஸ்கிரிப்டைப் பயன்படுத்தி, சில வகையான பொம்மைகளை உருவாக்கிக்கொண்டு மணிக்கணக்கில் அமைதியாக உட்கார்ந்து, விளையாட்டின் கூறுகளை முடிக்க அல்லது இயக்கத்தின் இயக்கவியலைச் சமாளிக்க நான் பெருமளவில் உந்துதல் பெற்றேன். / அல்லது மூன்றாம் தரப்பு நூலகங்கள், செருகுநிரல்கள் மற்றும் எல்லாவற்றையும் இணைக்கிறது.

சில சமயங்களில் கிட்டார் வாசிப்பது எனது விஷயம் அல்ல என்பதையும், நான் கேட்பதை விரும்புகிறேன், விளையாடுவதில்லை என்பதையும் உணர்ந்தேன். நான் கேம்கள் மற்றும் குறியீட்டை எழுதும்போது என் கண்கள் பிரகாசித்தன (அந்த நேரத்தில் எல்லா வகையான உலோகங்களையும் கேட்பது) அதைத்தான் நான் அப்போது விரும்பினேன், அதைத்தான் நான் செய்திருக்க வேண்டும்.

உங்களிடம் வேறு ஏதேனும் கேள்விகள் உள்ளதா?

நிச்சயமாக, எங்களால் எல்லா தலைப்புகளையும் கேள்விகளையும் பார்க்க முடியவில்லை, எனவே கருத்துகளை எழுதவும், எனக்கு PM செய்யவும் - கேள்விகள் இருப்பதில் நான் எப்போதும் மகிழ்ச்சியடைகிறேன்.

குறிப்புகள் தேதி விஞ்ஞானி: எங்கு தொடங்குவது மற்றும் அது அவசியமா?

குறிப்புகள் தேதி விஞ்ஞானி: எங்கு தொடங்குவது மற்றும் அது அவசியமா?

ஆதாரம்: www.habr.com

கருத்தைச் சேர்