2020 இல் தரவு விஞ்ஞானியாக என்ன படிக்க வேண்டும்

2020 இல் தரவு விஞ்ஞானியாக என்ன படிக்க வேண்டும்
இந்த இடுகையில், DAGsHub இன் இணை நிறுவனர் மற்றும் CTOவிடமிருந்து தரவு அறிவியலைப் பற்றிய பயனுள்ள தகவல்களின் ஆதாரங்களை உங்களுடன் பகிர்ந்து கொள்கிறோம் தேர்வில் ட்விட்டர் கணக்குகள் முதல் முழு அளவிலான பொறியியல் வலைப்பதிவுகள் வரை பல்வேறு ஆதாரங்கள் உள்ளன, அவை தாங்கள் தேடுவதை சரியாக அறிந்தவர்களை இலக்காகக் கொண்டுள்ளன. வெட்டு கீழ் விவரங்கள்.

ஆசிரியரிடமிருந்து:
நீங்கள் என்ன சாப்பிடுகிறீர்கள், அறிவுப் பணியாளர் என்ற முறையில் உங்களுக்கு நல்ல தகவல் உணவு தேவை. நான் மிகவும் பயனுள்ள அல்லது கவர்ச்சிகரமானதாகக் கருதும் தரவு அறிவியல், செயற்கை நுண்ணறிவு மற்றும் தொடர்புடைய தொழில்நுட்பங்கள் பற்றிய தகவல்களின் ஆதாரங்களைப் பகிர விரும்புகிறேன். இது உங்களுக்கும் உதவும் என்று நம்புகிறேன்!

இரண்டு நிமிட ஆவணங்கள்

சமீபத்திய நிகழ்வுகளைப் புதுப்பித்த நிலையில் வைத்திருக்க மிகவும் பொருத்தமான YouTube சேனல். சேனல் அடிக்கடி புதுப்பிக்கப்படும் மற்றும் அனைத்து தலைப்புகளிலும் தொற்றா உற்சாகத்தையும் நேர்மறையையும் ஹோஸ்ட் கொண்டுள்ளது. AI இல் மட்டுமின்றி, கணினி கிராபிக்ஸ் மற்றும் பிற பார்வைக்கு ஈர்க்கும் தலைப்புகளிலும் சுவாரஸ்யமான வேலைகளின் கவரேஜை எதிர்பார்க்கலாம்.

யானிக் கில்சர்

தனது YouTube சேனலில், Yannick தொழில்நுட்ப விவரங்களில் ஆழ்ந்த கற்றலில் குறிப்பிடத்தக்க ஆராய்ச்சியை விளக்குகிறார். சொந்தமாக ஒரு ஆய்வைப் படிப்பதற்குப் பதிலாக, முக்கியமான கட்டுரைகளைப் பற்றிய ஆழமான புரிதலைப் பெற, அதன் வீடியோக்களில் ஒன்றைப் பார்ப்பது பெரும்பாலும் விரைவாகவும் எளிதாகவும் இருக்கும். விளக்கங்கள் கணிதத்தைப் புறக்கணிக்காமல் அல்லது மூன்று பைன்களில் தொலைந்து போகாமல் கட்டுரைகளின் சாரத்தை வெளிப்படுத்துகின்றன. யானிக் ஆய்வுகள் எவ்வாறு ஒன்றாக பொருந்துகின்றன, எவ்வளவு தீவிரமாக முடிவுகளை எடுக்க வேண்டும், பரந்த விளக்கங்கள் மற்றும் பலவற்றைப் பற்றிய தனது கருத்துக்களையும் பகிர்ந்து கொள்கிறார். தொடக்கநிலையாளர்கள் (அல்லது கல்வியல்லாத பயிற்சியாளர்கள்) இந்த கண்டுபிடிப்புகளுக்கு தாங்களாகவே வருவது மிகவும் கடினமாக உள்ளது.

வடித்தல்.பப்

அவர்களின் சொந்த வார்த்தைகளில்:

இயந்திர கற்றல் ஆராய்ச்சி தெளிவாகவும், ஆற்றல் மிக்கதாகவும், துடிப்பாகவும் இருக்க வேண்டும். ஆராய்ச்சிக்கு உதவுவதற்காக டிஸ்டில் உருவாக்கப்பட்டது.

டிஸ்டில் ஒரு தனித்துவமான இயந்திர கற்றல் ஆராய்ச்சி வெளியீடு. வாசகருக்கு தலைப்புகள் பற்றிய உள்ளுணர்வுப் புரிதலைக் கொடுப்பதற்காக, பிரமிக்க வைக்கும் காட்சிப்படுத்தல்களுடன் கட்டுரைகள் விளம்பரப்படுத்தப்படுகின்றன. இயந்திர கற்றல் மற்றும் தரவு அறிவியல் தலைப்புகளைப் புரிந்துகொள்வதில் இடஞ்சார்ந்த சிந்தனையும் கற்பனையும் சிறப்பாகச் செயல்படுகின்றன. பாரம்பரிய வெளியீட்டு வடிவங்கள், மறுபுறம், அவற்றின் கட்டமைப்பில் கடினமானதாகவும், நிலையானதாகவும் உலர்ந்ததாகவும் இருக்கும், சில சமயங்களில் "கணிதம்". டிஸ்ட்டிலின் இணை-உருவாக்கிய கிறிஸ் ஓலா ஒரு அற்புதமான தனிப்பட்ட வலைப்பதிவையும் பராமரிக்கிறார் மகிழ்ச்சியா. இது நீண்ட காலமாக புதுப்பிக்கப்படவில்லை, ஆனால் இதுவரை எழுதப்பட்ட சிறந்த ஆழமான கற்றல் விளக்கங்களின் தொகுப்பாகவே உள்ளது. குறிப்பாக, அது எனக்கு மிகவும் உதவியது описание LSTM!

2020 இல் தரவு விஞ்ஞானியாக என்ன படிக்க வேண்டும்
மூல

செபாஸ்டியன் ருடர்

செபாஸ்டியன் ருடர் மிகவும் தகவலறிந்த வலைப்பதிவு மற்றும் செய்திமடலை எழுதுகிறார், முதன்மையாக நரம்பியல் நெட்வொர்க்குகளின் குறுக்குவெட்டு மற்றும் இயற்கை மொழி உரை பகுப்பாய்வு பற்றி. ஆராய்ச்சியாளர்கள் மற்றும் மாநாட்டு பேச்சாளர்களுக்கு அவர் நிறைய ஆலோசனைகளை வழங்குகிறார், நீங்கள் கல்வியில் இருந்தால் இது மிகவும் உதவியாக இருக்கும். செபாஸ்டியனின் கட்டுரைகள் மதிப்புரைகளின் வடிவத்தை எடுக்க முனைகின்றன, ஒரு குறிப்பிட்ட பகுதியில் உள்ள ஆராய்ச்சி மற்றும் முறைகளில் உள்ள கலையின் நிலையை சுருக்கி விளக்குகின்றன. இதன் பொருள், தங்கள் தாங்கு உருளைகளை விரைவாகப் பெற விரும்பும் பயிற்சியாளர்களுக்கு கட்டுரைகள் மிகவும் பயனுள்ளதாக இருக்கும். செபாஸ்டியனும் எழுதுகிறார் ட்விட்டர்.

ஆண்ட்ரி கார்பதி

Andrei Karpatyக்கு அறிமுகம் தேவையில்லை. பூமியில் மிகவும் பிரபலமான ஆழ்ந்த கற்றல் ஆராய்ச்சியாளர்களில் ஒருவராக இருப்பதோடு மட்டுமல்லாமல், அவர் பரவலாகப் பயன்படுத்தப்படும் கருவிகளை உருவாக்குகிறார் காப்பக நல்லறிவு காப்பாளர் பக்க திட்டங்களாக. அவரது ஸ்டான்போர்ட் பாடத்திட்டத்தின் மூலம் எண்ணற்ற மக்கள் இந்த மண்டலத்திற்குள் நுழைந்தனர். cs231n, மற்றும் அதை நீங்கள் தெரிந்து கொள்வது பயனுள்ளதாக இருக்கும் செய்முறையை நரம்பியல் நெட்வொர்க் பயிற்சி. அதைப் பார்க்கவும் பரிந்துரைக்கிறேன் பேச்சு நிஜ உலகில் இயந்திரக் கற்றலைப் பயன்படுத்த முயற்சிக்கும்போது டெஸ்லா சமாளிக்க வேண்டிய உண்மையான சிக்கல்களைப் பற்றி. பேச்சு தகவல், ஈர்க்கக்கூடிய மற்றும் நிதானமாக உள்ளது. ML பற்றிய கட்டுரைகளைத் தவிர, Andrey Karpaty தருகிறார் நல்ல வாழ்க்கை ஆலோசனை செய்ய லட்சிய விஞ்ஞானிகள். ஆண்ட்ரூவைப் படிக்கவும் ட்விட்டர் மற்றும் கிட்ஹப்.

உபெர் இன்ஜினியரிங்

Uber இன்ஜினியரிங் வலைப்பதிவு கவரேஜின் அளவு மற்றும் அகலத்தின் அடிப்படையில் மிகவும் ஈர்க்கக்கூடியதாக உள்ளது, குறிப்பாக நிறைய தலைப்புகளை உள்ளடக்கியது செயற்கை நுண்ணறிவு. Uber இன் பொறியியல் கலாச்சாரத்தில் நான் குறிப்பாக விரும்புவது மிகவும் சுவாரஸ்யமான மற்றும் மதிப்புமிக்க வெளியிடும் அவர்களின் போக்கு திட்டங்கள் அசுர வேகத்தில் திறந்த மூல. இங்கே சில உதாரணங்கள்:

OpenAI வலைப்பதிவு

சர்ச்சை ஒருபுறம் இருக்க, OpenAI வலைப்பதிவு மறுக்கமுடியாத அளவிற்கு சிறப்பானது. அவ்வப்போது, ​​வலைப்பதிவு OpenAI அளவில் மட்டுமே வரக்கூடிய ஆழமான கற்றல் பற்றிய உள்ளடக்கம் மற்றும் நுண்ணறிவுகளை இடுகையிடுகிறது: அனுமானம் நிகழ்வு ஆழமான இரட்டை வம்சாவளி. OpenAI குழு எப்போதாவது இடுகையிட முனைகிறது, ஆனால் இவை முக்கியமான உள்ளடக்கம்.

2020 இல் தரவு விஞ்ஞானியாக என்ன படிக்க வேண்டும்
மூல

தபூலா வலைப்பதிவு

Taboola வலைப்பதிவு இந்த இடுகையில் உள்ள மற்ற சில ஆதாரங்களைப் போல அறியப்படவில்லை, ஆனால் இது தனித்துவமானது என்று நான் நினைக்கிறேன் - "சாதாரண" வணிகத்திற்கான தயாரிப்பில் ML ஐப் பயன்படுத்த முயற்சிக்கும்போது ஆசிரியர்கள் மிகவும் சாதாரணமான, உண்மையான சிக்கல்களைப் பற்றி எழுதுகிறார்கள்: குறைவாக சுய-ஓட்டுநர் கார்கள் மற்றும் உலக சாம்பியன்களை வென்ற RL முகவர்கள், "எனது மாடல் இப்போது தவறான நம்பிக்கையுடன் விஷயங்களைக் கணிக்கிறதா என்று எனக்கு எப்படித் தெரியும்?". இந்த சிக்கல்கள் துறையில் பணிபுரியும் அனைவருக்கும் பொருத்தமானவை மற்றும் பொதுவான AI தலைப்புகளை விட குறைவான பத்திரிகை கவரேஜைப் பெறுகின்றன, ஆனால் இந்த சிக்கல்களை சரியாக தீர்க்க உலகத் தரம் வாய்ந்த திறமைகள் இன்னும் தேவைப்படுகின்றன. அதிர்ஷ்டவசமாக, தபூலாவிடம் இந்தத் திறமை மற்றும் அதைப் பற்றி எழுத விருப்பம் மற்றும் திறன் ஆகிய இரண்டும் உள்ளது, அதனால் மற்றவர்களும் கற்றுக்கொள்ள முடியும்.

ரெட்டிட்டில்

ட்விட்டருடன், கூட்டத்தின் ஆராய்ச்சி, கருவிகள் அல்லது ஞானம் ஆகியவற்றில் சிக்கிக் கொள்வதை விட ரெடிட்டில் சிறந்தது எதுவுமில்லை.

AI இன் நிலை

இடுகைகள் ஆண்டுதோறும் வெளியிடப்படுகின்றன, ஆனால் மிகவும் அடர்த்தியான தகவல்களால் நிரப்பப்படுகின்றன. இந்தப் பட்டியலில் உள்ள பிற ஆதாரங்களுடன் ஒப்பிடும்போது, ​​இது தொழில்நுட்பம் அல்லாத வணிகர்களுக்கு அணுகக்கூடியது. பேச்சுக்களில் நான் விரும்புவது என்னவென்றால், தொழில்துறை மற்றும் ஆராய்ச்சி எங்கு செல்கிறது என்பதைப் பற்றிய முழுமையான பார்வையை வழங்க முயற்சிக்கிறது, வன்பொருள், ஆராய்ச்சி, வணிகம் மற்றும் புவிசார் அரசியலில் கூட ஒரு பறவையின் பார்வையில் முன்னேற்றம் உள்ளது. ஆர்வத்தின் முரண்பாடுகளைப் பற்றி படிக்க இறுதியில் தொடங்குவதை உறுதிப்படுத்திக் கொள்ளுங்கள்.

பாட்காஸ்ட்கள்

வெளிப்படையாக, பாட்காஸ்ட்கள் தொழில்நுட்பத் தலைப்புகளைப் பற்றி அறிந்துகொள்வதற்குப் பொருத்தமாக இல்லை என்று நினைக்கிறேன். எல்லாவற்றிற்கும் மேலாக, அவர்கள் தலைப்புகளை விளக்குவதற்கு ஒலியை மட்டுமே பயன்படுத்துகின்றனர், மேலும் தரவு அறிவியல் மிகவும் காட்சித் துறையாகும். பாட்காஸ்ட்கள் பின்னர் இன்னும் ஆழமாக ஆராய்வதற்கு அல்லது தத்துவ விவாதங்களில் ஈடுபடுவதற்கு ஒரு காரணத்தை உங்களுக்கு வழங்குகின்றன. இருப்பினும், இங்கே சில பரிந்துரைகள் உள்ளன:

அற்புதமான பட்டியல்கள்

இங்கே கண்காணிப்பது குறைவு, ஆனால் நீங்கள் எதைத் தேடுகிறீர்கள் என்பது உங்களுக்குத் தெரிந்தவுடன் உதவியாக இருக்கும் கூடுதல் ஆதாரங்கள்:

ட்விட்டர்

  • மேட்டி மரியன்ஸ்கி
    நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்துவதற்கான அழகான, ஆக்கப்பூர்வமான வழிகளை மேட்டி கண்டறிந்தார், மேலும் அவரது முடிவுகளை உங்கள் Twitter ஊட்டத்தில் பார்ப்பது வேடிக்கையாக உள்ளது. குறைந்தபட்சம் பாருங்கள் இந்த பதவியை.
  • ஓரி கோஹன்
    ஓரி வெறும் ஓட்டும் இயந்திரம் வலைப்பதிவுகள். தரவு விஞ்ஞானிகளுக்கான பிரச்சனைகள் மற்றும் தீர்வுகள் பற்றி விரிவாக எழுதுகிறார். ஒரு கட்டுரை வெளியிடப்படும்போது அறிவிக்கப்படுவதற்கு குழுசேர மறக்காதீர்கள். அவரது சேகரிப்புகுறிப்பாக மிகவும் சுவாரசியமாக உள்ளது.
  • ஜெர்மி ஹோவர்ட்
    படைப்பாற்றல் மற்றும் உற்பத்தித்திறன் ஆகியவற்றின் விரிவான ஆதாரமான fast.ai இன் இணை நிறுவனர்.
  • ஹேமல் ஹுசைன்
    Github இல் உள்ள ML பொறியாளர், Hamel Hussain, தரவு களத்தில் குறியீட்டாளர்களுக்கான பல கருவிகளை உருவாக்கி அறிக்கையிடும் பணியில் மும்முரமாக இருக்கிறார்.
  • பிரான்சுவா சோலெட்
    கேரஸை உருவாக்கியவர், இப்போது முயற்சி செய் புத்திசாலித்தனம் என்றால் என்ன மற்றும் அதை எவ்வாறு சோதிப்பது என்பது பற்றிய நமது புரிதலை புதுப்பிக்கவும்.
  • ஹார்ட்மாரு
    கூகுள் மூளையில் ஆராய்ச்சி விஞ்ஞானி.

முடிவுக்கு

பட்டியலில் சேர்க்காதது அவமானமாக இருக்கும் உள்ளடக்கத்தின் சிறந்த ஆதாரங்களை ஆசிரியர் கண்டறிந்ததால் அசல் இடுகை புதுப்பிக்கப்படலாம். அவரைத் தொடர்பு கொள்ளலாம் ட்விட்டர்நீங்கள் ஏதாவது புதிய ஆதாரத்தை பரிந்துரைக்க விரும்பினால்! மேலும் DAGsHub பணியமர்த்துகிறது வழக்கறிஞர் [தோராயமாக. மொழிபெயர் பொது பயிற்சியாளர்] தரவு அறிவியலில், உங்கள் சொந்த தரவு அறிவியல் உள்ளடக்கத்தை நீங்கள் உருவாக்கினால், இடுகையின் ஆசிரியருக்கு எழுத தயங்க வேண்டாம்.

2020 இல் தரவு விஞ்ஞானியாக என்ன படிக்க வேண்டும்
பரிந்துரைக்கப்பட்ட ஆதாரங்களைப் படிப்பதன் மூலமும், விளம்பரக் குறியீடு மூலம் உருவாக்கவும் HABR, பேனரில் குறிப்பிடப்பட்டுள்ள தள்ளுபடியில் கூடுதலாக 10% பெறலாம்.

மேலும் படிப்புகள்

சிறப்புக் கட்டுரைகள்

ஆதாரம்: www.habr.com