எக்செல் பயனர்களுக்கான ஆர் மொழி (இலவச வீடியோ பாடநெறி)

தனிமைப்படுத்தல் காரணமாக, பலர் இப்போது தங்கள் நேரத்தின் சிங்கத்தின் பங்கை வீட்டிலேயே செலவிடுகிறார்கள், மேலும் இந்த நேரத்தை பயனுள்ளதாக செலவிடலாம்.

தனிமைப்படுத்தலின் தொடக்கத்தில், சில மாதங்களுக்கு முன்பு நான் தொடங்கிய சில திட்டங்களை முடிக்க முடிவு செய்தேன். இந்த திட்டங்களில் ஒன்று "எக்செல் பயனர்களுக்கான ஆர் மொழி" என்ற வீடியோ பாடமாகும். இந்த பாடத்திட்டத்தின் மூலம், R இல் நுழைவதற்கான தடையை குறைக்க விரும்பினேன், மேலும் ரஷ்ய மொழியில் இந்த தலைப்பில் இருக்கும் பயிற்சிப் பொருட்களின் பற்றாக்குறையை சற்று நிரப்ப விரும்புகிறேன்.

நீங்கள் பணிபுரியும் நிறுவனத்தில் டேட்டாவுடனான அனைத்து வேலைகளும் எக்செல் இல் முடிந்தால், நீங்கள் மிகவும் நவீனமான மற்றும் அதே நேரத்தில் முற்றிலும் இலவசமான தரவு பகுப்பாய்வுக் கருவியைப் பற்றி அறிந்துகொள்ளுமாறு பரிந்துரைக்கிறேன்.

எக்செல் பயனர்களுக்கான ஆர் மொழி (இலவச வீடியோ பாடநெறி)

உள்ளடக்கம்

நீங்கள் தரவு பகுப்பாய்வில் ஆர்வமாக இருந்தால், நீங்கள் என் மீது ஆர்வமாக இருக்கலாம் தந்தி и YouTube சேனல்கள். பெரும்பாலான உள்ளடக்கம் R மொழிக்கு அர்ப்பணிக்கப்பட்டுள்ளது.

  1. குறிப்புகள்
  2. பாடத்திட்டம் பற்றி
  3. இந்தப் படிப்பு யாருக்காக?
  4. பாடத்திட்டம்
    4.1. பாடம் 1: R மொழி மற்றும் RStudio மேம்பாட்டு சூழலை நிறுவுதல்
    4.2. பாடம் 2: R இல் உள்ள அடிப்படை தரவு கட்டமைப்புகள்
    4.3. பாடம் 3: TSV, CSV, Excel கோப்புகள் மற்றும் Google Sheets ஆகியவற்றிலிருந்து தரவைப் படித்தல்
    4.4. பாடம் 4: வரிசைகளை வடிகட்டுதல், நெடுவரிசைகளைத் தேர்ந்தெடுத்து மறுபெயரிடுதல், R இல் உள்ள பைப்லைன்கள்
    4.5. பாடம் 5: R இல் உள்ள அட்டவணையில் கணக்கிடப்பட்ட நெடுவரிசைகளைச் சேர்த்தல்
    4.6. பாடம் 6: R இல் தரவைத் தொகுத்தல் மற்றும் திரட்டுதல்
    4.7. பாடம் 7: R இல் அட்டவணைகளை செங்குத்தாகவும் கிடைமட்டமாகவும் இணைத்தல்
    4.8. பாடம் 8: R இல் சாளர செயல்பாடுகள்
    4.9. பாடம் 9: R இல் சுழலும் அட்டவணைகள் அல்லது பிவோட் அட்டவணைகளின் அனலாக்
    4.10. பாடம் 10: JSON கோப்புகளை R இல் ஏற்றுதல் மற்றும் பட்டியல்களை அட்டவணைகளாக மாற்றுதல்
    4.11. பாடம் 11: qplot() செயல்பாட்டைப் பயன்படுத்தி விரைவாக திட்டமிடுதல்
    4.12. பாடம் 12: ggplot2 தொகுப்பைப் பயன்படுத்தி அடுக்கு அடுக்கு அடுக்குகளை வரைதல்
  5. முடிவுக்கு

குறிப்புகள்

பாடத்திட்டம் பற்றி

பாடநெறி கட்டிடக்கலையைச் சுற்றி கட்டமைக்கப்பட்டுள்ளது tidyverse, மற்றும் அதில் உள்ள தொகுப்புகள்: readr, vroom, dplyr, tidyr, ggplot2. நிச்சயமாக, R இல் இதே போன்ற செயல்பாடுகளைச் செய்யும் மற்ற நல்ல தொகுப்புகள் உள்ளன data.table, ஆனால் தொடரியல் tidyverse உள்ளுணர்வு, பயிற்சி பெறாத பயனர் கூட படிக்க எளிதானது, எனவே R மொழியைக் கற்கத் தொடங்குவது நல்லது என்று நினைக்கிறேன் tidyverse.

இந்த பாடநெறியானது அனைத்து தரவு பகுப்பாய்வு செயல்பாடுகள் மூலம் உங்களுக்கு வழிகாட்டும், ஏற்றுதல் முதல் முடிக்கப்பட்ட முடிவை காட்சிப்படுத்துதல் வரை.

ஏன் ஆர் மற்றும் பைதான் இல்லை? ஆர் ஒரு செயல்பாட்டு மொழி என்பதால், எக்செல் பயனர்கள் அதற்கு மாறுவது எளிது பாரம்பரிய பொருள் சார்ந்த நிரலாக்கத்தை ஆராய வேண்டிய அவசியமில்லை.

இந்த நேரத்தில், 12 வீடியோ பாடங்கள் திட்டமிடப்பட்டுள்ளன, ஒவ்வொன்றும் 5 முதல் 20 நிமிடங்கள் வரை நீடிக்கும்.

பாடங்கள் படிப்படியாக திறக்கப்படும். ஒவ்வொரு திங்கட்கிழமையும் எனது இணையதளத்தில் புதிய பாடத்திற்கான அணுகலைத் திறப்பேன். YouTube சேனல் ஒரு தனி பிளேலிஸ்ட்டில்.

இந்தப் படிப்பு யாருக்காக?

தலைப்பிலிருந்து இது தெளிவாக இருப்பதாக நான் நினைக்கிறேன், இருப்பினும், நான் அதை இன்னும் விரிவாக விவரிக்கிறேன்.

மைக்ரோசாஃப்ட் எக்செல் செயலியை தங்கள் வேலையில் தீவிரமாகப் பயன்படுத்துபவர்களை இலக்காகக் கொண்டு இந்த பாடநெறி உள்ளது மற்றும் அவர்களின் எல்லா வேலைகளையும் தரவுகளுடன் செயல்படுத்துகிறது. பொதுவாக, மைக்ரோசாஃப்ட் எக்செல் அப்ளிகேஷனை வாரத்திற்கு ஒரு முறையாவது திறந்தால், பாடநெறி உங்களுக்கு ஏற்றதாக இருக்கும்.

படிப்பை முடிக்க உங்களுக்கு நிரலாக்க திறன்கள் தேவையில்லை, ஏனென்றால்... பாடநெறி ஆரம்பநிலையை இலக்காகக் கொண்டது.

ஆனால், ஒருவேளை, பாடம் 4 இலிருந்து தொடங்கி, செயலில் உள்ள R பயனர்களுக்கும் சுவாரஸ்யமான பொருள் இருக்கும், ஏனெனில்... போன்ற தொகுப்புகளின் முக்கிய செயல்பாடு dplyr и tidyr சற்று விரிவாக விவாதிக்கப்படும்.

பாடத்திட்டம்

பாடம் 1: R மொழி மற்றும் RStudio மேம்பாட்டு சூழலை நிறுவுதல்

வெளியீட்டு தேதி: மார்ச் 23 2020

மேற்கோள்கள்:

வீடியோக்கள்:

விளக்கம்:
தேவையான மென்பொருளை பதிவிறக்கம் செய்து நிறுவி, RStudio மேம்பாட்டு சூழலின் திறன்கள் மற்றும் இடைமுகத்தை சுருக்கமாக ஆராய்வோம்.

பாடம் 2: R இல் உள்ள அடிப்படை தரவு கட்டமைப்புகள்

வெளியீட்டு தேதி: மார்ச் 30 2020

மேற்கோள்கள்:

வீடியோக்கள்:

விளக்கம்:
R மொழியில் என்ன தரவு கட்டமைப்புகள் உள்ளன என்பதைப் புரிந்துகொள்ள இந்தப் பாடம் உதவும்.வெக்டர்கள், தேதி பிரேம்கள் மற்றும் பட்டியல்களை விரிவாகப் பார்ப்போம். அவற்றை எவ்வாறு உருவாக்குவது மற்றும் அவற்றின் தனிப்பட்ட கூறுகளை அணுகுவது எப்படி என்பதைக் கற்றுக்கொள்வோம்.

பாடம் 3: TSV, CSV, Excel கோப்புகள் மற்றும் Google Sheets ஆகியவற்றிலிருந்து தரவைப் படித்தல்

வெளியீட்டு தேதி: ஏப்ரல் 6 2020

மேற்கோள்கள்:

வீடியோக்கள்:

விளக்கம்:
கருவியைப் பொருட்படுத்தாமல் தரவுகளுடன் பணிபுரிவது அதன் பிரித்தெடுப்புடன் தொடங்குகிறது. பாடத்தின் போது தொகுப்புகள் பயன்படுத்தப்படுகின்றன vroom, readxl, googlesheets4 csv, tsv, Excel கோப்புகள் மற்றும் Google Sheets ஆகியவற்றிலிருந்து R சூழலில் தரவை ஏற்றுவதற்கு.

பாடம் 4: வரிசைகளை வடிகட்டுதல், நெடுவரிசைகளைத் தேர்ந்தெடுத்து மறுபெயரிடுதல், R இல் உள்ள பைப்லைன்கள்

வெளியீட்டு தேதி: ஏப்ரல் 13 2020

மேற்கோள்கள்:

வீடியோக்கள்:

விளக்கம்:
இந்த பாடம் தொகுப்பு பற்றியது dplyr. டேட்டாஃப்ரேம்களை எவ்வாறு வடிகட்டுவது, தேவையான நெடுவரிசைகளைத் தேர்ந்தெடுத்து அவற்றை மறுபெயரிடுவது எப்படி என்பதைக் கண்டுபிடிப்போம்.

பைப்லைன்கள் என்றால் என்ன என்பதையும் அவை உங்கள் R குறியீட்டை மேலும் படிக்கக்கூடியதாக மாற்ற எப்படி உதவுகின்றன என்பதையும் அறிந்துகொள்வோம்.

பாடம் 5: R இல் உள்ள அட்டவணையில் கணக்கிடப்பட்ட நெடுவரிசைகளைச் சேர்த்தல்

வெளியீட்டு தேதி: ஏப்ரல் 20 2020

மேற்கோள்கள்:

வீடியோக்கள்:

விளக்கம்:
இந்த காணொளியில் நூலகத்துடனான எங்கள் அறிமுகத்தை தொடர்கிறோம் tidyverse மற்றும் தொகுப்பு dplyr.
செயல்பாடுகளின் குடும்பத்தைப் பார்ப்போம் mutate(), மற்றும் அட்டவணையில் புதிய கணக்கிடப்பட்ட நெடுவரிசைகளைச் சேர்க்க அவற்றை எவ்வாறு பயன்படுத்துவது என்பதைக் கற்றுக்கொள்வோம்.

பாடம் 6: R இல் தரவைத் தொகுத்தல் மற்றும் திரட்டுதல்

வெளியீட்டு தேதி: ஏப்ரல் 27 2020

மேற்கோள்கள்:

வீடியோக்கள்:

விளக்கம்:
இந்த பாடம் தரவு பகுப்பாய்வு, குழுவாக்கம் மற்றும் ஒருங்கிணைத்தல் ஆகியவற்றின் முக்கிய செயல்பாடுகளில் ஒன்றிற்கு அர்ப்பணிக்கப்பட்டுள்ளது. பாடத்தின் போது நாம் தொகுப்பைப் பயன்படுத்துவோம் dplyr மற்றும் அம்சங்கள் group_by() и summarise().

செயல்பாடுகளின் முழு குடும்பத்தையும் நாங்கள் பார்ப்போம் summarise(), IE summarise(), summarise_if() и summarise_at().

பாடம் 7: R இல் அட்டவணைகளை செங்குத்தாகவும் கிடைமட்டமாகவும் இணைத்தல்

வெளியீட்டு தேதி: 4 மே 2020

மேற்கோள்கள்:

வீடியோக்கள்:

விளக்கம்:
அட்டவணைகளின் செங்குத்து மற்றும் கிடைமட்ட இணைப்பின் செயல்பாடுகளைப் புரிந்துகொள்ள இந்தப் பாடம் உதவும்.

செங்குத்து ஒன்றியம் என்பது SQL வினவல் மொழியில் உள்ள UNION செயல்பாட்டிற்குச் சமமானதாகும்.

VLOOKUP செயல்பாட்டிற்கு நன்றி, கிடைமட்ட இணைப்பானது எக்செல் பயனர்களுக்கு நன்கு தெரியும்; SQL இல், அத்தகைய செயல்பாடுகள் JOIN ஆபரேட்டரால் செய்யப்படுகின்றன.

பாடத்தின் போது ஒரு நடைமுறை சிக்கலைத் தீர்ப்போம், அதன் போது நாங்கள் தொகுப்புகளைப் பயன்படுத்துவோம் dplyr, readxl, tidyr и stringr.

நாங்கள் கருத்தில் கொள்ளும் முக்கிய செயல்பாடுகள்:

  • bind_rows() - அட்டவணைகளின் செங்குத்து இணைப்பு
  • left_join() - அட்டவணைகளின் கிடைமட்ட இணைப்பு
  • semi_join() - சேரும் அட்டவணைகள் உட்பட
  • anti_join() - பிரத்தியேக அட்டவணை சேர்க்கை

பாடம் 8: R இல் சாளர செயல்பாடுகள்

வெளியீட்டு தேதி: 11 மே 2020

மேற்கோள்கள்:

விளக்கம்:
சாளர செயல்பாடுகள் ஒருங்கிணைக்கும் பொருளில் ஒத்தவை; அவை மதிப்புகளின் வரிசையை உள்ளீடாக எடுத்து அவற்றில் எண்கணித செயல்பாடுகளைச் செய்கின்றன, ஆனால் வெளியீட்டு முடிவில் வரிசைகளின் எண்ணிக்கையை மாற்ற வேண்டாம்.

இந்த டுடோரியலில் நாம் தொகுப்பை தொடர்ந்து படிக்கிறோம் dplyr, மற்றும் செயல்பாடுகள் group_by(), mutate(), அத்துடன் புதியது cumsum(), lag(), lead() и arrange().

பாடம் 9: R இல் சுழலும் அட்டவணைகள் அல்லது பிவோட் அட்டவணைகளின் அனலாக்

வெளியீட்டு தேதி: 18 மே 2020

மேற்கோள்கள்:

விளக்கம்:
பெரும்பாலான எக்செல் பயனர்கள் பிவோட் டேபிள்களைப் பயன்படுத்துகின்றனர்; இது ஒரு வசதியான கருவியாகும், இதன் மூலம் நீங்கள் மூல தரவுகளின் வரிசையை சில நொடிகளில் படிக்கக்கூடிய அறிக்கைகளாக மாற்றலாம்.

இந்த டுடோரியலில் R இல் அட்டவணைகளை எவ்வாறு சுழற்றுவது என்பதைப் பார்ப்போம், மேலும் அவற்றை அகலத்திலிருந்து நீண்ட வடிவத்திற்கு மாற்றுவது மற்றும் நேர்மாறாகவும்.

பாடத்தின் பெரும்பகுதி தொகுப்புக்கு அர்ப்பணிக்கப்பட்டுள்ளது tidyr மற்றும் செயல்பாடுகள் pivot_longer() и pivot_wider().

பாடம் 10: JSON கோப்புகளை R இல் ஏற்றுதல் மற்றும் பட்டியல்களை அட்டவணைகளாக மாற்றுதல்

வெளியீட்டு தேதி: 25 மே 2020

மேற்கோள்கள்:

விளக்கம்:
JSON மற்றும் XML ஆகியவை தகவல்களைச் சேமிப்பதற்கும் பரிமாறிக்கொள்வதற்கும் மிகவும் பிரபலமான வடிவங்களாகும், பொதுவாக அவற்றின் கச்சிதத்தன்மை காரணமாக.

ஆனால் அத்தகைய வடிவங்களில் வழங்கப்பட்ட தரவை பகுப்பாய்வு செய்வது கடினம், எனவே பகுப்பாய்விற்கு முன் அதை அட்டவணை வடிவத்தில் கொண்டு வருவது அவசியம், இந்த வீடியோவில் நாம் கற்றுக்கொள்வோம்.

பாடம் தொகுப்புக்கு அர்ப்பணிக்கப்பட்டுள்ளது tidyr, நூலகத்தின் மையப் பகுதியில் சேர்க்கப்பட்டுள்ளது tidyverse, மற்றும் செயல்பாடுகள் unnest_longer(), unnest_wider() и hoist().

பாடம் 11: qplot() செயல்பாட்டைப் பயன்படுத்தி விரைவாக திட்டமிடுதல்

வெளியீட்டு தேதி: 1 2020 ஜூன்

மேற்கோள்கள்:

விளக்கம்:
தொகுப்பு ggplot2 R இல் மட்டுமல்லாமல் மிகவும் பிரபலமான தரவு காட்சிப்படுத்தல் கருவிகளில் ஒன்றாகும்.

இந்த பாடத்தில் செயல்பாட்டைப் பயன்படுத்தி எளிய வரைபடங்களை எவ்வாறு உருவாக்குவது என்பதைக் கற்றுக்கொள்வோம் qplot(), மற்றும் அவரது அனைத்து வாதங்களையும் பகுப்பாய்வு செய்வோம்.

பாடம் 12: ggplot2 தொகுப்பைப் பயன்படுத்தி அடுக்கு அடுக்கு அடுக்குகளை வரைதல்

வெளியீட்டு தேதி: 8 2020 ஜூன்

மேற்கோள்கள்:

விளக்கம்:
பாடம் தொகுப்பின் முழு சக்தியையும் நிரூபிக்கிறது ggplot2 மற்றும் அதில் பதிக்கப்பட்ட அடுக்குகளில் வரைபடங்களை உருவாக்குவதற்கான இலக்கணம்.

தொகுப்பில் உள்ள முக்கிய வடிவவியலை நாங்கள் பகுப்பாய்வு செய்வோம் மற்றும் வரைபடத்தை உருவாக்க அடுக்குகளை எவ்வாறு பயன்படுத்துவது என்பதைக் கற்றுக்கொள்வோம்.

முடிவுக்கு

R மொழி போன்ற சக்திவாய்ந்த தரவு பகுப்பாய்வுக் கருவியைக் கற்றுக்கொள்வதில் முதல் படிகளை எடுக்க உங்களுக்குத் தேவையான மிகத் தேவையான தகவல்களை மட்டும் முன்னிலைப்படுத்த, பாடத்திட்டத்தின் உருவாக்கத்தை முடிந்தவரை சுருக்கமாக அணுக முயற்சித்தேன்.

R மொழியைப் பயன்படுத்தி தரவு பகுப்பாய்விற்கான ஒரு முழுமையான வழிகாட்டி அல்ல, ஆனால் இதற்கு தேவையான அனைத்து நுட்பங்களையும் புரிந்து கொள்ள இது உதவும்.

பாடத்திட்டம் 12 வாரங்களுக்கு வடிவமைக்கப்பட்டிருந்தாலும், ஒவ்வொரு வாரமும் திங்கட்கிழமைகளில் புதிய பாடங்களுக்கான அணுகலைத் திறப்பேன், எனவே நான் பரிந்துரைக்கிறேன் பதிவு யூடியூப் சேனலில் புதிய பாடத்தை வெளியிடுவதைத் தவறவிடாதீர்கள்.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்