Limbaj R pentru utilizatorii Excel (curs video gratuit)

Din cauza carantinei, mulți își petrec acum cea mai mare parte din timpul lor acasă, iar acest timp poate și chiar ar trebui să fie petrecut cu folos.

La începutul carantinei, am decis să termin câteva proiecte pe care le-am început acum câteva luni. Unul dintre aceste proiecte a fost cursul video „R Language for Excel Users”. Cu acest curs, am vrut să scad bariera de intrare în R și să umplu puțin lipsa existentă de materiale de instruire pe această temă în limba rusă.

Dacă toate lucrările cu date din compania pentru care lucrați sunt încă efectuate în Excel, atunci vă sugerez să vă familiarizați cu un instrument de analiză a datelor mai modern și, în același timp, complet gratuit.

Limbaj R pentru utilizatorii Excel (curs video gratuit)

Conținut

Dacă ești interesat de analiza datelor, s-ar putea să fii interesat de analiza mea telegramă и youtube canale. Cea mai mare parte a conținutului este dedicat limbajului R.

  1. referințe
  2. Despre curs
  3. Pentru cine este acest curs?
  4. Programul cursului
    4.1. Lecția 1: Instalarea limbajului R și a mediului de dezvoltare RStudio
    4.2. Lecția 2: Structuri de date de bază în R
    4.3. Lecția 3: Citirea datelor din fișiere TSV, CSV, Excel și Foi de calcul Google
    4.4. Lecția 4: Filtrarea rândurilor, selectarea și redenumirea coloanelor, conductelor în R
    4.5. Lecția 5: Adăugarea coloanelor calculate la un tabel în R
    4.6. Lecția 6: Gruparea și agregarea datelor în R
    4.7. Lecția 7: Îmbinarea verticală și orizontală a tabelelor în R
    4.8. Lecția 8: Funcțiile ferestrei în R
    4.9. Lecția 9: Tabelele rotative sau un analog al tabelelor pivot în R
    4.10. Lecția 10: Încărcarea fișierelor JSON în R și conversia listelor în tabele
    4.11. Lecția 11: Trasarea rapidă folosind funcția qplot().
    4.12. Lecția 12: Trasarea graficelor strat cu strat folosind pachetul ggplot2
  5. Concluzie

referințe

Despre curs

Cursul este structurat în jurul arhitecturii tidyverse, și pachetele incluse în acesta: readr, vroom, dplyr, tidyr, ggplot2. Desigur, există și alte pachete bune în R care efectuează operațiuni similare, de exemplu data.table, dar sintaxa tidyverse intuitiv, ușor de citit chiar și pentru un utilizator neinstruit, așa că cred că este mai bine să începi să înveți limbajul R cu tidyverse.

Cursul vă va ghida prin toate operațiunile de analiză a datelor, de la încărcare până la vizualizarea rezultatului final.

De ce R și nu Python? Deoarece R este un limbaj funcțional, este mai ușor pentru utilizatorii Excel să treacă la el, deoarece nu este nevoie să vă aprofundați în programarea tradițională orientată pe obiecte.

În prezent, sunt planificate 12 lecții video, cu o durată de la 5 la 20 de minute fiecare.

Lecțiile se vor deschide treptat. În fiecare luni voi deschide accesul la o nouă lecție pe site-ul meu. Canalul canalului YouTube într-o listă de redare separată.

Pentru cine este acest curs?

Cred că acest lucru este clar din titlu, totuși, îl voi descrie mai detaliat.

Cursul se adresează celor care folosesc în mod activ Microsoft Excel în munca lor și implementează toată munca lor cu date acolo. În general, dacă deschizi aplicația Microsoft Excel cel puțin o dată pe săptămână, atunci cursul este potrivit pentru tine.

Nu trebuie să aveți abilități de programare pentru a finaliza cursul, deoarece... Cursul se adresează începătorilor.

Dar, poate, începând cu lecția 4, va exista material interesant și pentru utilizatorii activi ai R, pentru că... funcționalitatea principală a unor astfel de pachete precum dplyr и tidyr va fi discutat în detaliu.

Programul cursului

Lecția 1: Instalarea limbajului R și a mediului de dezvoltare RStudio

Data publicării: Martie 23 2020

referințe:

video:

Descriere:
O lecție introductivă în timpul căreia vom descărca și instala software-ul necesar și vom examina pe scurt capacitățile și interfața mediului de dezvoltare RStudio.

Lecția 2: Structuri de date de bază în R

Data publicării: Martie 30 2020

referințe:

video:

Descriere:
Această lecție vă va ajuta să înțelegeți ce structuri de date sunt disponibile în limbajul R. Vom analiza în detaliu vectori, cadre de date și liste. Să învățăm cum să le creăm și să accesăm elementele lor individuale.

Lecția 3: Citirea datelor din fișiere TSV, CSV, Excel și Foi de calcul Google

Data publicării: Aprilie 6 2020

referințe:

video:

Descriere:
Lucrul cu date, indiferent de instrument, începe cu extragerea acestora. Pachetele sunt folosite în timpul lecției vroom, readxl, googlesheets4 pentru încărcarea datelor în mediul R din fișiere csv, tsv, Excel și Foi de calcul Google.

Lecția 4: Filtrarea rândurilor, selectarea și redenumirea coloanelor, conductelor în R

Data publicării: Aprilie 13 2020

referințe:

video:

Descriere:
Această lecție este despre pachet dplyr. În el ne vom da seama cum să filtram cadrele de date, să selectăm coloanele necesare și să le redenumim.

Vom afla, de asemenea, ce sunt conductele și cum vă ajută să faceți codul dvs. R mai lizibil.

Lecția 5: Adăugarea coloanelor calculate la un tabel în R

Data publicării: Aprilie 20 2020

referințe:

video:

Descriere:
În acest videoclip continuăm cunoștințele noastre cu biblioteca tidyverse și pachet dplyr.
Să ne uităm la familia de funcții mutate(), și vom învăța cum să le folosim pentru a adăuga noi coloane calculate la tabel.

Lecția 6: Gruparea și agregarea datelor în R

Data publicării: Aprilie 27 2020

referințe:

video:

Descriere:
Această lecție este dedicată uneia dintre operațiunile principale de analiză, grupare și agregare a datelor. În timpul lecției vom folosi pachetul dplyr și caracteristici group_by() и summarise().

Ne vom uita la întreaga familie de funcții summarise(), adică summarise(), summarise_if() и summarise_at().

Lecția 7: Îmbinarea verticală și orizontală a tabelelor în R

Data publicării: 4 May 2020

referințe:

video:

Descriere:
Această lecție vă va ajuta să înțelegeți operațiunile de îmbinare verticală și orizontală a meselor.

O unire verticală este echivalentul operației UNION în limbajul de interogare SQL.

Unirea orizontală este mai cunoscută utilizatorilor de Excel datorită funcției VLOOKUP; în SQL, astfel de operațiuni sunt efectuate de operatorul JOIN.

Pe parcursul lecției vom rezolva o problemă practică în timpul căreia vom folosi pachete dplyr, readxl, tidyr и stringr.

Principalele funcții pe care le vom lua în considerare:

  • bind_rows() - îmbinare verticală a meselor
  • left_join() — îmbinare orizontală a meselor
  • semi_join() - inclusiv mesele de îmbinare
  • anti_join() - alăturare exclusivă la masă

Lecția 8: Funcțiile ferestrei în R

Data publicării: 11 May 2020

referințe:

Descriere:
Funcțiile ferestrei sunt similare ca semnificație cu cele de agregare; ele iau, de asemenea, o matrice de valori ca intrare și efectuează operații aritmetice asupra lor, dar nu modifică numărul de rânduri din rezultatul de ieșire.

În acest tutorial continuăm să studiem pachetul dplyr, și funcții group_by(), mutate(), precum și noi cumsum(), lag(), lead() и arrange().

Lecția 9: Tabelele rotative sau un analog al tabelelor pivot în R

Data publicării: 18 May 2020

referințe:

Descriere:
Majoritatea utilizatorilor Excel folosesc tabele pivot; acesta este un instrument convenabil cu care puteți transforma o serie de date brute în rapoarte care pot fi citite în câteva secunde.

În acest tutorial ne vom uita la cum să rotiți tabelele în R și să le convertim din format larg în format lung și invers.

Cea mai mare parte a lecției este dedicată pachetului tidyr si functii pivot_longer() и pivot_wider().

Lecția 10: Încărcarea fișierelor JSON în R și conversia listelor în tabele

Data publicării: 25 May 2020

referințe:

Descriere:
JSON și XML sunt formate extrem de populare pentru stocarea și schimbul de informații, de obicei datorită compactității lor.

Dar este dificil să analizezi datele prezentate în astfel de formate, așa că înainte de analiză este necesar să le aducem într-o formă tabelară, care este exact ceea ce vom afla în acest videoclip.

Lecția este dedicată pachetului tidyr, inclusă în miezul bibliotecii tidyverse, și funcții unnest_longer(), unnest_wider() и hoist().

Lecția 11: Trasarea rapidă folosind funcția qplot().

Data publicării: 1 2020 iunie

referințe:

Descriere:
pachet ggplot2 este unul dintre cele mai populare instrumente de vizualizare a datelor nu numai în R.

În această lecție vom învăța cum să construim grafice simple folosind funcția qplot(), și să analizăm toate argumentele ei.

Lecția 12: Trasarea graficelor strat cu strat folosind pachetul ggplot2

Data publicării: 8 2020 iunie

referințe:

Descriere:
Lecția demonstrează întreaga putere a pachetului ggplot2 și gramatica construirii graficelor în straturi încorporate în el.

Vom analiza principalele geometrii care sunt prezente în pachet și vom învăța cum să aplicăm straturi pentru a construi un grafic.

Concluzie

Am încercat să abordez cât mai concis formarea programului de curs, pentru a evidenția doar cele mai necesare informații de care veți avea nevoie pentru a face primii pași în învățarea unui instrument atât de puternic de analiză a datelor precum limbajul R.

Cursul nu este un ghid exhaustiv pentru analiza datelor folosind limbajul R, dar vă va ajuta să înțelegeți toate tehnicile necesare pentru aceasta.

În timp ce programul de curs este conceput pentru 12 săptămâni, în fiecare săptămână în zilele de luni voi deschide accesul la noi lecții, așa că recomand Abonati-va pe canalul YouTube pentru a nu rata publicarea unei noi lecții.

Sursa: www.habr.com

Adauga un comentariu