एक्सेल वापरकर्त्यांसाठी आर भाषा (विनामूल्य व्हिडिओ कोर्स)

क्वारंटाईनमुळे, आता बरेच लोक त्यांचा सिंहाचा वाटा घरी घालवतात, आणि हा वेळ उपयुक्तपणे घालवला जाऊ शकतो आणि केला पाहिजे.

क्वारंटाईनच्या सुरुवातीला, मी काही महिन्यांपूर्वी सुरू केलेले काही प्रकल्प पूर्ण करण्याचा निर्णय घेतला. यापैकी एक प्रकल्प "R Language for Excel Users" हा व्हिडिओ कोर्स होता. या कोर्ससह, मला R मध्ये प्रवेशाचा अडथळा कमी करायचा होता आणि रशियन भाषेत या विषयावरील प्रशिक्षण सामग्रीची सध्याची कमतरता थोडीशी भरून काढायची होती.

तुम्ही ज्या कंपनीसाठी काम करता त्या कंपनीतील डेटासह सर्व काम अजूनही एक्सेलमध्ये केले असल्यास, मी तुम्हाला अधिक आधुनिक आणि त्याच वेळी पूर्णपणे विनामूल्य, डेटा विश्लेषण साधनाशी परिचित व्हावे असे सुचवितो.

एक्सेल वापरकर्त्यांसाठी आर भाषा (विनामूल्य व्हिडिओ कोर्स)

सामग्री

तुम्हाला डेटा विश्लेषणामध्ये स्वारस्य असल्यास, तुम्हाला माझ्यामध्ये स्वारस्य असेल तार и YouTube चॅनेल बहुतेक सामग्री आर भाषेला समर्पित आहे.

  1. संदर्भ
  2. कोर्स बद्दल
  3. हा कोर्स कोणासाठी आहे?
  4. अभ्यासक्रम कार्यक्रम
    4.1. धडा 1: R भाषा आणि RStudio विकास वातावरण स्थापित करणे
    4.2. धडा 2: R मधील मूलभूत डेटा संरचना
    4.3. धडा 3: TSV, CSV, Excel फायली आणि Google Sheets वरून डेटा वाचणे
    4.4. धडा 4: पंक्ती फिल्टर करणे, स्तंभ निवडणे आणि त्यांचे नाव बदलणे, R मध्ये पाइपलाइन
    4.5. धडा 5: आर मधील टेबलमध्ये गणना केलेले स्तंभ जोडणे
    4.6. धडा 6: R मध्ये डेटाचे समूहीकरण आणि एकत्रीकरण
    4.7. धडा 7: आर मधील सारण्यांचे अनुलंब आणि क्षैतिज जोडणे
    4.8. धडा 8: आर मधील विंडो फंक्शन्स
    4.9. धडा 9: फिरवत सारण्या किंवा आर मधील मुख्य सारण्यांचे अॅनालॉग
    4.10. धडा 10: JSON फाईल्स R मध्ये लोड करणे आणि याद्या टेबल्समध्ये रूपांतरित करणे
    4.11. धडा 11: qplot() फंक्शन वापरून पटकन प्लॉटिंग
    4.12. धडा 12: ggplot2 पॅकेज वापरून लेयर बाय लेयर प्लॉटिंग
  5. निष्कर्ष

संदर्भ

कोर्स बद्दल

अभ्यासक्रमाची रचना आर्किटेक्चरच्या आसपास आहे tidyverse, आणि त्यात समाविष्ट असलेली पॅकेजेस: readr, vroom, dplyr, tidyr, ggplot2. अर्थात, R मध्ये इतर चांगली पॅकेजेस आहेत जी समान ऑपरेशन करतात, उदाहरणार्थ data.table, पण वाक्यरचना tidyverse अंतर्ज्ञानी, अप्रशिक्षित वापरकर्त्यासाठी देखील वाचण्यास सोपे, म्हणून मला वाटते की यासह आर भाषा शिकणे सुरू करणे चांगले आहे tidyverse.

हा कोर्स तुम्हाला सर्व डेटा अॅनालिसिस ऑपरेशन्समध्ये मार्गदर्शन करेल, लोडिंगपासून ते पूर्ण झालेल्या निकालाची कल्पना करण्यापर्यंत.

आर आणि पायथन का नाही? कारण R ही एक कार्यशील भाषा आहे, एक्सेल वापरकर्त्यांसाठी त्यावर स्विच करणे सोपे आहे, कारण पारंपारिक ऑब्जेक्ट-ओरिएंटेड प्रोग्रामिंगमध्ये जाण्याची गरज नाही.

याक्षणी, 12 व्हिडिओ धडे नियोजित आहेत, प्रत्येकी 5 ते 20 मिनिटांपर्यंत.

धडे हळूहळू उघडतील. दर सोमवारी मी माझ्या वेबसाइटवर नवीन धड्याचा प्रवेश उघडेन. YouTube चॅनेल वेगळ्या प्लेलिस्टमध्ये.

हा कोर्स कोणासाठी आहे?

मला वाटते की हे शीर्षकावरून स्पष्ट आहे, तथापि, मी त्याचे अधिक तपशीलवार वर्णन करेन.

हा कोर्स त्यांच्या कामात मायक्रोसॉफ्ट एक्सेलचा सक्रियपणे वापर करणार्‍यांसाठी आहे आणि त्यांची सर्व कामे डेटासह कार्यान्वित करतात. सर्वसाधारणपणे, जर तुम्ही आठवड्यातून किमान एकदा मायक्रोसॉफ्ट एक्सेल ऍप्लिकेशन उघडले तर कोर्स तुमच्यासाठी योग्य आहे.

अभ्यासक्रम पूर्ण करण्यासाठी तुमच्याकडे प्रोग्रामिंग कौशल्ये असणे आवश्यक नाही, कारण... कोर्स नवशिक्यांसाठी आहे.

परंतु, कदाचित, धडा 4 पासून प्रारंभ करून, सक्रिय R वापरकर्त्यांसाठी देखील मनोरंजक सामग्री असेल, कारण... अशा पॅकेजेसची मुख्य कार्यक्षमता dplyr и tidyr काही तपशीलवार चर्चा केली जाईल.

अभ्यासक्रम कार्यक्रम

धडा 1: R भाषा आणि RStudio विकास वातावरण स्थापित करणे

प्रकाशनाची तारीख: मार्च 23 2020

दुवे:

व्हिडिओ:

वर्णन:
एक प्रास्ताविक धडा ज्या दरम्यान आम्ही आवश्यक सॉफ्टवेअर डाउनलोड आणि स्थापित करू आणि RStudio विकास वातावरणाच्या क्षमता आणि इंटरफेसचे थोडक्यात परीक्षण करू.

धडा 2: R मधील मूलभूत डेटा संरचना

प्रकाशनाची तारीख: मार्च 30 2020

दुवे:

व्हिडिओ:

वर्णन:
हा धडा तुम्हाला R भाषेत कोणती डेटा स्ट्रक्चर्स उपलब्ध आहेत हे समजण्यास मदत करेल. आम्ही वेक्टर्स, डेट फ्रेम्स आणि लिस्टमध्ये तपशीलवार पाहू. चला ते कसे तयार करायचे आणि त्यांच्या वैयक्तिक घटकांमध्ये प्रवेश कसा करायचा ते शिकूया.

धडा 3: TSV, CSV, Excel फायली आणि Google Sheets वरून डेटा वाचणे

प्रकाशनाची तारीख: एप्रिल 6 2020

दुवे:

व्हिडिओ:

वर्णन:
डेटासह कार्य करणे, साधनाची पर्वा न करता, त्याच्या निष्कर्षाने सुरू होते. धड्या दरम्यान पॅकेजेस वापरली जातात vroom, readxl, googlesheets4 csv, tsv, Excel फाइल्स आणि Google Sheets वरून R वातावरणात डेटा लोड करण्यासाठी.

धडा 4: पंक्ती फिल्टर करणे, स्तंभ निवडणे आणि त्यांचे नाव बदलणे, R मध्ये पाइपलाइन

प्रकाशनाची तारीख: एप्रिल 13 2020

दुवे:

व्हिडिओ:

वर्णन:
हा धडा पॅकेजबद्दल आहे dplyr. त्यात आपण डेटाफ्रेम्स कसे फिल्टर करायचे ते शोधून काढू, आवश्यक कॉलम्स सिलेक्ट करू आणि त्यांचे नाव बदलू.

आम्ही हे देखील शिकू की पाइपलाइन काय आहेत आणि ते तुमचा R कोड अधिक वाचनीय बनविण्यात कशी मदत करतात.

धडा 5: आर मधील टेबलमध्ये गणना केलेले स्तंभ जोडणे

प्रकाशनाची तारीख: एप्रिल 20 2020

दुवे:

व्हिडिओ:

वर्णन:
या व्हिडिओमध्ये आम्ही लायब्ररीशी आमची ओळख सुरू ठेवतो tidyverse आणि पॅकेज dplyr.
फंक्शन्सचे कुटुंब पाहू mutate(), आणि टेबलमध्ये नवीन गणना केलेले स्तंभ जोडण्यासाठी ते कसे वापरायचे ते आपण शिकू.

धडा 6: R मध्ये डेटाचे समूहीकरण आणि एकत्रीकरण

प्रकाशनाची तारीख: एप्रिल 27 2020

दुवे:

व्हिडिओ:

वर्णन:
हा धडा डेटा विश्लेषण, समूहीकरण आणि एकत्रीकरणाच्या मुख्य ऑपरेशन्सपैकी एकासाठी समर्पित आहे. धड्या दरम्यान आम्ही पॅकेज वापरू dplyr आणि वैशिष्ट्ये group_by() и summarise().

आपण फंक्शन्सचे संपूर्ण कुटुंब पाहू summarise(), म्हणजे summarise(), summarise_if() и summarise_at().

धडा 7: आर मधील सारण्यांचे अनुलंब आणि क्षैतिज जोडणे

प्रकाशनाची तारीख: 4 मे 2020

दुवे:

व्हिडिओ:

वर्णन:
हा धडा तुम्हाला टेबल्सच्या उभ्या आणि क्षैतिज जोडणीची क्रिया समजून घेण्यास मदत करेल.

व्हर्टिकल युनियन हे SQL क्वेरी भाषेतील UNION ऑपरेशनचे समतुल्य आहे.

VLOOKUP फंक्शनमुळे एक्सेल वापरकर्त्यांना क्षैतिज जोडणे अधिक चांगले ओळखले जाते; SQL मध्ये, जॉइन ऑपरेटरद्वारे असे ऑपरेशन केले जातात.

धड्यादरम्यान आम्ही एक व्यावहारिक समस्या सोडवू ज्या दरम्यान आम्ही पॅकेजेस वापरू dplyr, readxl, tidyr и stringr.

आम्ही विचार करणारी मुख्य कार्ये:

  • bind_rows() - टेबल्सचे उभ्या जोडणे
  • left_join() - सारण्यांचे आडवे जोडणे
  • semi_join() - जॉइनिंग टेबल्ससह
  • anti_join() - अनन्य टेबल सामील

धडा 8: आर मधील विंडो फंक्शन्स

प्रकाशनाची तारीख: 11 मे 2020

दुवे:

वर्णन:
विंडो फंक्शन्स एकत्रित करण्याच्या अर्थाने समान आहेत; ते इनपुट म्हणून मूल्यांचा अॅरे देखील घेतात आणि त्यावर अंकगणित ऑपरेशन्स करतात, परंतु आउटपुट परिणामातील पंक्तींची संख्या बदलत नाहीत.

या ट्युटोरियलमध्ये आपण पॅकेजचा अभ्यास सुरू ठेवतो dplyr, आणि कार्ये group_by(), mutate(), तसेच नवीन cumsum(), lag(), lead() и arrange().

धडा 9: फिरवत सारण्या किंवा आर मधील मुख्य सारण्यांचे अॅनालॉग

प्रकाशनाची तारीख: 18 मे 2020

दुवे:

वर्णन:
बहुतेक एक्सेल वापरकर्ते पिव्होट टेबल्स वापरतात; हे एक सोयीस्कर साधन आहे ज्याच्या मदतीने तुम्ही काही सेकंदात वाचनीय अहवालांमध्ये कच्च्या डेटाचे अॅरे बदलू शकता.

या ट्युटोरियलमध्ये आपण टेबल्स R मध्ये कसे फिरवायचे आणि रुंद ते लाँग फॉरमॅटमध्ये कसे बदलायचे ते पाहू.

बहुतेक धडा पॅकेजसाठी समर्पित आहे tidyr आणि कार्ये pivot_longer() и pivot_wider().

धडा 10: JSON फाईल्स R मध्ये लोड करणे आणि याद्या टेबल्समध्ये रूपांतरित करणे

प्रकाशनाची तारीख: 25 मे 2020

दुवे:

वर्णन:
JSON आणि XML हे माहिती संचयित करण्यासाठी आणि देवाणघेवाण करण्यासाठी अत्यंत लोकप्रिय स्वरूप आहेत, सहसा त्यांच्या संक्षिप्ततेमुळे.

परंतु अशा स्वरूपांमध्ये सादर केलेल्या डेटाचे विश्लेषण करणे कठीण आहे, म्हणून विश्लेषण करण्यापूर्वी ते सारणीच्या स्वरूपात आणणे आवश्यक आहे, जे आपण या व्हिडिओमध्ये शिकणार आहोत.

धडा पॅकेजसाठी समर्पित आहे tidyr, लायब्ररीच्या गाभ्यामध्ये समाविष्ट आहे tidyverse, आणि कार्ये unnest_longer(), unnest_wider() и hoist().

धडा 11: qplot() फंक्शन वापरून पटकन प्लॉटिंग

प्रकाशनाची तारीख: 1 2020 जून

दुवे:

वर्णन:
पॅकेज ggplot2 केवळ आर मध्येच नव्हे तर सर्वात लोकप्रिय डेटा व्हिज्युअलायझेशन साधनांपैकी एक आहे.

या धड्यात आपण फंक्शन वापरून साधे आलेख कसे बनवायचे ते शिकू qplot(), आणि तिच्या सर्व युक्तिवादांचे विश्लेषण करूया.

धडा 12: ggplot2 पॅकेज वापरून लेयर बाय लेयर प्लॉटिंग

प्रकाशनाची तारीख: 8 2020 जून

दुवे:

वर्णन:
धडा पॅकेजची पूर्ण शक्ती दर्शवितो ggplot2 आणि त्यात एम्बेड केलेल्या स्तरांमध्ये आलेख तयार करण्याचे व्याकरण.

आम्ही पॅकेजमध्ये उपस्थित असलेल्या मुख्य भूमितींचे विश्लेषण करू आणि आलेख तयार करण्यासाठी स्तर कसे लावायचे ते शिकू.

निष्कर्ष

आर लँग्वेज सारखे शक्तिशाली डेटा विश्लेषण साधन शिकण्यासाठी पहिली पावले उचलण्यासाठी तुम्हाला आवश्यक असलेली सर्वात आवश्यक माहिती हायलाइट करण्यासाठी मी शक्य तितक्या संक्षिप्तपणे कोर्स प्रोग्रामच्या निर्मितीकडे जाण्याचा प्रयत्न केला.

हा कोर्स R भाषेचा वापर करून डेटा विश्लेषणासाठी संपूर्ण मार्गदर्शक नाही, परंतु यासाठी तुम्हाला सर्व आवश्यक तंत्रे समजून घेण्यात मदत होईल.

कोर्स प्रोग्राम 12 आठवड्यांसाठी डिझाइन केलेला असताना, प्रत्येक आठवड्यात सोमवारी मी नवीन धड्यांचा प्रवेश उघडेन, म्हणून मी शिफारस करतो सदस्यता घ्या नवीन धड्याचे प्रकाशन चुकवू नये म्हणून YouTube चॅनेलवर.

स्त्रोत: www.habr.com

एक टिप्पणी जोडा