Karantinə görə, indi çoxları vaxtının aslan payını evdə keçirir və bu vaxtı faydalı keçirmək olar, hətta lazımdır.
Karantinin əvvəlində bir neçə ay əvvəl başladığım bəzi layihələri bitirmək qərarına gəldim. Bu layihələrdən biri də “Excel istifadəçiləri üçün R dili” video kursu idi. Bu kursla mən R-yə daxil olmaq üçün maneəni azaltmaq və bu mövzuda rus dilində mövcud təlim materiallarının çatışmazlığını bir az doldurmaq istədim.
Əgər işlədiyiniz şirkətdə verilənlərlə bütün işlər hələ də Excel-də aparılırsa, o zaman sizə daha müasir, eyni zamanda tamamilə pulsuz məlumatların təhlili vasitəsi ilə tanış olmağı təklif edirəm.

Məzmun
Əgər məlumatların təhlili ilə maraqlanırsınızsa, mənimlə maraqlana bilərsiniz и kanallar. Məzmununun çoxu R dilinə həsr olunub.
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
4.10.
4.11.
4.12.
References
Kurs haqqında
Kurs memarlıq ətrafında qurulub tidyverse, və ona daxil olan paketlər: readr, vroom, dplyr, tidyr, ggplot2. Əlbəttə ki, R-də oxşar əməliyyatları yerinə yetirən başqa yaxşı paketlər də var, məsələn data.table, lakin sintaksis tidyverse intuitiv, hətta təcrübəsiz istifadəçi üçün də oxumaq asandır, ona görə də məncə R dilini öyrənməyə başlamaq daha yaxşıdır tidyverse.
Kurs yükləmədən hazır nəticənin vizuallaşdırılmasına qədər bütün məlumatların təhlili əməliyyatları üzrə sizə rəhbərlik edəcək.
Niyə Python deyil, R? R funksional dil olduğu üçün Excel istifadəçilərinin ona keçməsi daha asandır, çünki ənənəvi obyekt yönümlü proqramlaşdırma ilə məşğul olmağa ehtiyac yoxdur.
Hazırda hər biri 12 dəqiqədən 5 dəqiqəyə qədər davam edən 20 video dərs planlaşdırılır.
Dərslər tədricən açılacaq. Hər bazar ertəsi saytımda yeni dərsə giriş açacağam. ayrı bir pleylistdə.
Bu kurs kimlər üçündür?
Düşünürəm ki, bu, başlıqdan aydındır, lakin mən bunu daha ətraflı təsvir edəcəyəm.
Kurs öz işlərində Microsoft Excel-dən fəal istifadə edən və orada verilənlərlə bütün işlərini həyata keçirənlər üçün nəzərdə tutulub. Ümumiyyətlə, ən azı həftədə bir dəfə Microsoft Excel proqramını açırsınızsa, kurs sizin üçün uyğundur.
Kursu bitirmək üçün proqramlaşdırma bacarıqlarına ehtiyacınız yoxdur, çünki... Kurs yeni başlayanlar üçün nəzərdə tutulub.
Amma bəlkə də 4-cü dərsdən başlayaraq aktiv R istifadəçiləri üçün də maraqlı materiallar olacaq, çünki... kimi paketlərin əsas funksionallığı dplyr и tidyr bir qədər ətraflı müzakirə olunacaq.
Kurs proqramı
Dərs 1: R dilinin və RStudio inkişaf mühitinin quraşdırılması
Nəşr tarixi: 23 Mart 2020
Referanslar:
Video:

Description:
Lazımi proqram təminatını yükləyib quraşdıracağımız, RStudio inkişaf mühitinin imkanlarını və interfeysini qısaca araşdıracağımız giriş dərsi.
Dərs 2: R-də Əsas Məlumat Strukturları
Nəşr tarixi: 30 Mart 2020
Referanslar:
Video:

Description:
Bu dərs sizə R dilində hansı məlumat strukturlarının mövcud olduğunu başa düşməyə kömək edəcək.Vektorlara, tarix çərçivələrinə və siyahılara ətraflı baxacağıq. Gəlin onları necə yaratmağı və fərdi elementlərinə daxil olmağı öyrənək.
Dərs 3: TSV, CSV, Excel faylları və Google Cədvəldən verilənlərin oxunması
Nəşr tarixi: April 6 2020
Referanslar:
Video:

Description:
Alətdən asılı olmayaraq verilənlərlə işləmək onun çıxarılmasından başlayır. Dərs zamanı paketlərdən istifadə olunur vroom, readxl, googlesheets4 csv, tsv, Excel faylları və Google Sheets-dən R mühitinə məlumat yükləmək üçün.
Dərs 4: R-də sətirlərin süzülməsi, sütunların, boru kəmərlərinin seçilməsi və adının dəyişdirilməsi
Nəşr tarixi: April 13 2020
Referanslar:
Video:

Description:
Bu dərs paket haqqındadır dplyr. Burada məlumat çərçivələrini necə süzgəcdən keçirəcəyik, lazımi sütunları seçəcəyik və onların adını dəyişdirəcəyik.
Biz həmçinin boru kəmərlərinin nə olduğunu və R kodunuzu daha oxunaqlı etməyə necə kömək etdiyini öyrənəcəyik.
Dərs 5: R-də cədvələ hesablanmış sütunların əlavə edilməsi
Nəşr tarixi: April 20 2020
Referanslar:
Video:

Description:
Bu videoda kitabxana ilə tanışlığımızı davam etdiririk tidyverse və paket dplyr.
Gəlin funksiyalar ailəsinə nəzər salaq mutate(), və cədvələ yeni hesablanmış sütunlar əlavə etmək üçün onlardan necə istifadə edəcəyimizi öyrənəcəyik.
Dərs 6: R-də verilənlərin qruplaşdırılması və ümumiləşdirilməsi
Nəşr tarixi: April 27 2020
Referanslar:
Video:

Description:
Bu dərs məlumatların təhlili, qruplaşdırılması və toplanmasının əsas əməliyyatlarından birinə həsr edilmişdir. Dərs zamanı paketdən istifadə edəcəyik dplyr və xüsusiyyətləri group_by() и summarise().
Bütün funksiyalar ailəsinə baxacağıq summarise()Yəni summarise(), summarise_if() и summarise_at().
Dərs 7: R-də cədvəllərin şaquli və üfüqi birləşdirilməsi
Nəşr tarixi: May 4 2020
Referanslar:
Video:

Description:
Bu dərs cədvəllərin şaquli və üfüqi birləşdirilməsi əməliyyatlarını başa düşməyə kömək edəcəkdir.
Şaquli birləşmə SQL sorğu dilində UNION əməliyyatının ekvivalentidir.
Horizontal birləşmə VLOOKUP funksiyası sayəsində Excel istifadəçilərinə daha yaxşı məlumdur, SQL-də bu cür əməliyyatlar JOIN operatoru tərəfindən həyata keçirilir.
Dərs zamanı biz paketlərdən istifadə edəcəyimiz praktiki problemi həll edəcəyik dplyr, readxl, tidyr и stringr.
Nəzərə alacağımız əsas funksiyalar:
bind_rows()- cədvəllərin şaquli birləşməsileft_join()— cədvəllərin üfüqi birləşməsisemi_join()- qoşulma masaları daxil olmaqlaanti_join()- eksklüziv masa birləşməsi
Dərs 8: R-də pəncərə funksiyaları
Nəşr tarixi: May 11 2020
Referanslar:
Description:
Pəncərə funksiyaları məna baxımından ümumiləşdirmə funksiyalarına bənzəyir; onlar həmçinin giriş kimi bir sıra dəyərlər alır və onlar üzərində arifmetik əməliyyatlar yerinə yetirirlər, lakin çıxış nəticəsində sətirlərin sayını dəyişdirmirlər.
Bu dərslikdə paketi öyrənməyə davam edirik dplyr, və funksiyaları group_by(), mutate(), həm də yeni cumsum(), lag(), lead() и arrange().
Dərs 9: Fırlanan masalar və ya R-də pivot masaların analoqu
Nəşr tarixi: May 18 2020
Referanslar:
Description:
Əksər Excel istifadəçiləri pivot cədvəllərindən istifadə edir; bu, bir neçə saniyə ərzində bir sıra xam məlumatları oxuna bilən hesabatlara çevirə biləcəyiniz rahat bir vasitədir.
Bu dərslikdə biz cədvəlləri R-də necə fırlatmaq və onları geniş formatdan uzun formata və əksinə çevirmək yollarına baxacağıq.
Dərsin çox hissəsi paketə həsr olunub tidyr və funksiyaları pivot_longer() и pivot_wider().
Dərs 10: R-də JSON fayllarının yüklənməsi və siyahıların cədvəllərə çevrilməsi
Nəşr tarixi: May 25 2020
Referanslar:
Description:
JSON və XML, adətən yığcamlığına görə məlumatın saxlanması və mübadiləsi üçün son dərəcə populyar formatlardır.
Ancaq bu cür formatlarda təqdim olunan məlumatları təhlil etmək çətindir, buna görə də təhlil etməzdən əvvəl onu cədvəl formasına gətirmək lazımdır, bu videoda öyrənəcəyimiz şey budur.
Dərs paketə həsr olunub tidyr, kitabxananın özəyinə daxildir tidyverse, və funksiyaları unnest_longer(), unnest_wider() и hoist().
Dərs 11: qplot() funksiyasından istifadə edərək tez planların qurulması
Nəşr tarixi: İyun 1 2020
Referanslar:
Description:
Paketi ggplot2 yalnız R-də deyil, ən məşhur məlumat vizuallaşdırma vasitələrindən biridir.
Bu dərsdə funksiyadan istifadə edərək sadə qrafiklər qurmağı öyrənəcəyik qplot(), və gəlin onun bütün arqumentlərini təhlil edək.
Dərs 12: ggplot2 paketindən istifadə edərək qat-qat planlarının çəkilməsi
Nəşr tarixi: İyun 8 2020
Referanslar:
Description:
Dərs paketin tam gücünü nümayiş etdirir ggplot2 və ona daxil edilmiş təbəqələrdə qrafiklərin qurulmasının qrammatikası.
Paketdə mövcud olan əsas həndəsələri təhlil edəcəyik və qrafik qurmaq üçün təbəqələrin necə tətbiq olunacağını öyrənəcəyik.
Nəticə
Kurs proqramının formalaşmasına mümkün qədər yığcam yanaşmağa, R dili kimi güclü məlumat təhlili alətini öyrənməkdə ilk addımları atmaq üçün sizə lazım olacaq ən zəruri məlumatları vurğulamağa çalışdım.
Kurs R-dən istifadə edərək məlumatların təhlili üçün hərtərəfli bələdçi deyil, lakin bunun üçün bütün lazımi texnikaları başa düşməyə kömək edəcəkdir.
Kurs proqramı 12 həftə üçün nəzərdə tutulsa da, hər həftə bazar ertəsi yeni dərslərə giriş açacağam, ona görə də tövsiyə edirəm yeni dərsin dərcini qaçırmamaq üçün YouTube kanalında.
Mənbə: www.habr.com
