R jezik za korisnike Excela (besplatan video kurs)

Zbog karantina mnogi sada lavovski dio svog vremena provode kod kuće, a ovo vrijeme može, pa čak i treba, biti korisno utrošeno.

Na početku karantina odlučio sam da završim neke projekte koje sam započeo prije nekoliko mjeseci. Jedan od tih projekata bio je i video kurs „R jezik za korisnike Excel-a“. Ovim kursom sam želeo da spustim barijeru ulasku u R, i malo popunim postojeći nedostatak materijala za obuku o ovoj temi na ruskom jeziku.

Ako se sav rad s podacima u kompaniji u kojoj radite i dalje obavlja u Excelu, onda vam predlažem da se upoznate sa modernijim, a ujedno potpuno besplatnim alatom za analizu podataka.

R jezik za korisnike Excela (besplatan video kurs)

Sadržaj

Ako ste zainteresovani za analizu podataka, možda će vas zanimati moja telegram и youtube kanala. Većina sadržaja je posvećena R jeziku.

  1. reference
  2. O kursu
  3. Za koga je ovaj kurs?
  4. Program kursa
    4.1. Lekcija 1: Instaliranje R jezika i razvojnog okruženja RStudio
    4.2. Lekcija 2: Osnovne strukture podataka u R
    4.3. Lekcija 3: Čitanje podataka iz TSV, CSV, Excel datoteka i Google tablica
    4.4. Lekcija 4: Filtriranje redova, odabir i preimenovanje stupaca, cjevovoda u R
    4.5. Lekcija 5: Dodavanje izračunatih kolona u tablicu u R
    4.6. Lekcija 6: Grupiranje i agregiranje podataka u R
    4.7. Lekcija 7: Vertikalno i horizontalno spajanje tablica u R
    4.8. Lekcija 8: Funkcije prozora u R
    4.9. Lekcija 9: Rotirajuće tablice ili analogne stožerne tablice u R
    4.10. Lekcija 10: Učitavanje JSON datoteka u R i pretvaranje lista u tabele
    4.11. Lekcija 11: Brzo crtanje pomoću funkcije qplot().
    4.12. Lekcija 12: Iscrtavanje slojeva po slojevima pomoću paketa ggplot2
  5. zaključak

reference

O kursu

Kurs je strukturiran oko arhitekture tidyverse, i paketi uključeni u njega: readr, vroom, dplyr, tidyr, ggplot2. Naravno, postoje i drugi dobri paketi u R-u koji izvode slične operacije, na primjer data.table, ali sintaksa tidyverse intuitivan, lak za čitanje čak i za neobučenog korisnika, pa mislim da je bolje početi učiti jezik R sa tidyverse.

Kurs će vas voditi kroz sve operacije analize podataka, od učitavanja do vizualizacije gotovog rezultata.

Zašto R, a ne Python? Budući da je R funkcionalan jezik, korisnicima Excel-a je lakše preći na njega, jer nema potrebe da ulazite u tradicionalno objektno orijentisano programiranje.

Trenutno je planirano 12 video lekcija u trajanju od 5 do 20 minuta.

Lekcije će se otvarati postepeno. Svakog ponedjeljka otvaram pristup novoj lekciji na svojoj web stranici. YouTube kanal u zasebnoj plejlisti.

Za koga je ovaj kurs?

Mislim da je to jasno iz naslova, međutim, opisat ću ga detaljnije.

Kurs je namijenjen onima koji aktivno koriste Microsoft Excel u svom radu i tamo implementiraju sav svoj rad sa podacima. Općenito, ako otvorite aplikaciju Microsoft Excel barem jednom sedmično, onda je kurs prikladan za vas.

Za završetak kursa nije potrebno posedovati veštine programiranja, jer... Kurs je namenjen početnicima.

Ali, možda će, počevši od lekcije 4, biti zanimljivog materijala i za aktivne R korisnike, jer... glavna funkcionalnost takvih paketa kao što su dplyr и tidyr biće razmotreno pobliže.

Program kursa

Lekcija 1: Instaliranje R jezika i razvojnog okruženja RStudio

Datum objave: Mart 23 2020

Reference:

Video:

Opis:
Uvodna lekcija tokom koje ćemo preuzeti i instalirati potreban softver, te ukratko ispitati mogućnosti i interfejs razvojnog okruženja RStudio.

Lekcija 2: Osnovne strukture podataka u R

Datum objave: Mart 30 2020

Reference:

Video:

Opis:
Ova lekcija će vam pomoći da shvatite koje su strukture podataka dostupne u jeziku R. Pogledaćemo detaljno vektore, okvire datuma i liste. Naučimo kako ih kreirati i pristupiti njihovim pojedinačnim elementima.

Lekcija 3: Čitanje podataka iz TSV, CSV, Excel datoteka i Google tablica

Datum objave: April 6 2020

Reference:

Video:

Opis:
Rad s podacima, bez obzira na alat, počinje njihovim izdvajanjem. Paketi se koriste tokom nastave vroom, readxl, googlesheets4 za učitavanje podataka u R okruženje iz csv, tsv, Excel datoteka i Google Sheets.

Lekcija 4: Filtriranje redova, odabir i preimenovanje stupaca, cjevovoda u R

Datum objave: April 13 2020

Reference:

Video:

Opis:
Ova lekcija je o paketu dplyr. U njemu ćemo shvatiti kako filtrirati okvire podataka, odabrati potrebne stupce i preimenovati ih.

Također ćemo naučiti šta su cevovodi i kako oni pomažu da vaš R kod bude čitljiviji.

Lekcija 5: Dodavanje izračunatih kolona u tablicu u R

Datum objave: April 20 2020

Reference:

Video:

Opis:
U ovom videu nastavljamo naše upoznavanje sa bibliotekom tidyverse i paket dplyr.
Pogledajmo porodicu funkcija mutate(), a mi ćemo naučiti kako ih koristiti za dodavanje novih izračunatih kolona u tablicu.

Lekcija 6: Grupiranje i agregiranje podataka u R

Datum objave: April 27 2020

Reference:

Video:

Opis:
Ova lekcija je posvećena jednoj od glavnih operacija analize, grupisanja i agregacije podataka. Tokom lekcije koristićemo paket dplyr i karakteristike group_by() и summarise().

Pogledat ćemo cijelu porodicu funkcija summarise()tj. summarise(), summarise_if() и summarise_at().

Lekcija 7: Vertikalno i horizontalno spajanje tablica u R

Datum objave: 4 Maj 2020

Reference:

Video:

Opis:
Ova lekcija će vam pomoći da shvatite operacije vertikalnog i horizontalnog spajanja stolova.

Vertikalna unija je ekvivalent UNION operaciji u SQL upitnom jeziku.

Horizontalno spajanje je bolje poznato korisnicima programa Excel zahvaljujući funkciji VLOOKUP; u SQL-u takve operacije izvodi JOIN operator.

Tokom lekcije ćemo riješiti praktični zadatak tokom kojeg ćemo koristiti pakete dplyr, readxl, tidyr и stringr.

Glavne funkcije koje ćemo razmotriti:

  • bind_rows() - vertikalno spajanje stolova
  • left_join() — horizontalno spajanje stolova
  • semi_join() - uključujući spojne stolove
  • anti_join() - ekskluzivno spajanje stola

Lekcija 8: Funkcije prozora u R

Datum objave: 11 Maj 2020

Reference:

Opis:
Funkcije prozora slične su po značenju funkcijama agregiranja; one također uzimaju niz vrijednosti kao ulaz i izvode aritmetičke operacije nad njima, ali ne mijenjaju broj redova u izlaznom rezultatu.

U ovom tutorijalu nastavljamo s proučavanjem paketa dplyr, i funkcije group_by(), mutate(), kao i novi cumsum(), lag(), lead() и arrange().

Lekcija 9: Rotirajuće tablice ili analogne stožerne tablice u R

Datum objave: 18 Maj 2020

Reference:

Opis:
Većina korisnika Excela koristi zaokretne tablice; ovo je zgodan alat pomoću kojeg možete pretvoriti niz sirovih podataka u čitljive izvještaje u nekoliko sekundi.

U ovom vodiču ćemo pogledati kako rotirati tablice u R-u i pretvoriti ih iz širokog u dugi format i obrnuto.

Veći dio lekcije posvećen je paketu tidyr i funkcije pivot_longer() и pivot_wider().

Lekcija 10: Učitavanje JSON datoteka u R i pretvaranje lista u tabele

Datum objave: 25 Maj 2020

Reference:

Opis:
JSON i XML su izuzetno popularni formati za pohranjivanje i razmjenu informacija, obično zbog svoje kompaktnosti.

No, teško je analizirati podatke predstavljene u takvim formatima, pa ih je prije analize potrebno dovesti u tabelarni oblik, što ćemo upravo naučiti u ovom videu.

Lekcija je posvećena paketu tidyr, uključena u jezgro biblioteke tidyverse, i funkcije unnest_longer(), unnest_wider() и hoist().

Lekcija 11: Brzo crtanje pomoću funkcije qplot().

Datum objave: 1 2020 juni

Reference:

Opis:
Paket ggplot2 je jedan od najpopularnijih alata za vizualizaciju podataka ne samo u R.

U ovoj lekciji ćemo naučiti kako napraviti jednostavne grafove koristeći funkciju qplot(), i hajde da analiziramo sve njene argumente.

Lekcija 12: Iscrtavanje slojeva po slojevima pomoću paketa ggplot2

Datum objave: 8 2020 juni

Reference:

Opis:
Lekcija pokazuje punu snagu paketa ggplot2 i gramatiku građenja grafova u slojevima koji su ugrađeni u njega.

Analizirat ćemo glavne geometrije koje su prisutne u paketu i naučiti kako primijeniti slojeve za izradu grafa.

zaključak

Pokušao sam da pristupim formiranju programa kursa što je moguće konciznije, da istaknem samo najneophodnije informacije koje će vam trebati da napravite prve korake u učenju tako moćnog alata za analizu podataka kao što je R jezik.

Kurs nije iscrpan vodič za analizu podataka koristeći R jezik, ali će vam pomoći da shvatite sve potrebne tehnike za to.

Dok je program kursa predviđen za 12 sedmica, svake sedmice ponedjeljkom otvaram pristup novim časovima, pa preporučujem pretplatite se na YouTube kanalu kako ne biste propustili objavljivanje nove lekcije.

izvor: www.habr.com

Dodajte komentar