R jezik za korisnike Excela (besplatan video kurs)
Zbog karantina mnogi sada lavovski dio svog vremena provode kod kuće, a ovo vrijeme može, pa čak i treba, biti korisno utrošeno.
Na početku karantina odlučio sam da završim neke projekte koje sam započeo prije nekoliko mjeseci. Jedan od tih projekata bio je i video kurs „R jezik za korisnike Excel-a“. Ovim kursom sam želeo da spustim barijeru ulasku u R, i malo popunim postojeći nedostatak materijala za obuku o ovoj temi na ruskom jeziku.
Ako se sav rad s podacima u kompaniji u kojoj radite i dalje obavlja u Excelu, onda vam predlažem da se upoznate sa modernijim, a ujedno potpuno besplatnim alatom za analizu podataka.
Sadržaj
Ako ste zainteresovani za analizu podataka, možda će vas zanimati moja telegram и youtube kanala. Većina sadržaja je posvećena R jeziku.
Kurs je strukturiran oko arhitekture tidyverse, i paketi uključeni u njega: readr, vroom, dplyr, tidyr, ggplot2. Naravno, postoje i drugi dobri paketi u R-u koji izvode slične operacije, na primjer data.table, ali sintaksa tidyverse intuitivan, lak za čitanje čak i za neobučenog korisnika, pa mislim da je bolje početi učiti jezik R sa tidyverse.
Kurs će vas voditi kroz sve operacije analize podataka, od učitavanja do vizualizacije gotovog rezultata.
Zašto R, a ne Python? Budući da je R funkcionalan jezik, korisnicima Excel-a je lakše preći na njega, jer nema potrebe da ulazite u tradicionalno objektno orijentisano programiranje.
Trenutno je planirano 12 video lekcija u trajanju od 5 do 20 minuta.
Lekcije će se otvarati postepeno. Svakog ponedjeljka otvaram pristup novoj lekciji na svojoj web stranici. YouTube kanal u zasebnoj plejlisti.
Za koga je ovaj kurs?
Mislim da je to jasno iz naslova, međutim, opisat ću ga detaljnije.
Kurs je namijenjen onima koji aktivno koriste Microsoft Excel u svom radu i tamo implementiraju sav svoj rad sa podacima. Općenito, ako otvorite aplikaciju Microsoft Excel barem jednom sedmično, onda je kurs prikladan za vas.
Za završetak kursa nije potrebno posedovati veštine programiranja, jer... Kurs je namenjen početnicima.
Ali, možda će, počevši od lekcije 4, biti zanimljivog materijala i za aktivne R korisnike, jer... glavna funkcionalnost takvih paketa kao što su dplyr и tidyr biće razmotreno pobliže.
Program kursa
Lekcija 1: Instaliranje R jezika i razvojnog okruženja RStudio
Opis:
Ova lekcija će vam pomoći da shvatite koje su strukture podataka dostupne u jeziku R. Pogledaćemo detaljno vektore, okvire datuma i liste. Naučimo kako ih kreirati i pristupiti njihovim pojedinačnim elementima.
Lekcija 3: Čitanje podataka iz TSV, CSV, Excel datoteka i Google tablica
Opis:
Rad s podacima, bez obzira na alat, počinje njihovim izdvajanjem. Paketi se koriste tokom nastave vroom, readxl, googlesheets4 za učitavanje podataka u R okruženje iz csv, tsv, Excel datoteka i Google Sheets.
Lekcija 4: Filtriranje redova, odabir i preimenovanje stupaca, cjevovoda u R
Opis:
U ovom videu nastavljamo naše upoznavanje sa bibliotekom tidyverse i paket dplyr.
Pogledajmo porodicu funkcija mutate(), a mi ćemo naučiti kako ih koristiti za dodavanje novih izračunatih kolona u tablicu.
Opis:
Ova lekcija je posvećena jednoj od glavnih operacija analize, grupisanja i agregacije podataka. Tokom lekcije koristićemo paket dplyr i karakteristike group_by() и summarise().
Pogledat ćemo cijelu porodicu funkcija summarise()tj. summarise(), summarise_if() и summarise_at().
Lekcija 7: Vertikalno i horizontalno spajanje tablica u R
Opis:
Funkcije prozora slične su po značenju funkcijama agregiranja; one također uzimaju niz vrijednosti kao ulaz i izvode aritmetičke operacije nad njima, ali ne mijenjaju broj redova u izlaznom rezultatu.
U ovom tutorijalu nastavljamo s proučavanjem paketa dplyr, i funkcije group_by(), mutate(), kao i novi cumsum(), lag(), lead() и arrange().
Lekcija 9: Rotirajuće tablice ili analogne stožerne tablice u R
Opis:
Većina korisnika Excela koristi zaokretne tablice; ovo je zgodan alat pomoću kojeg možete pretvoriti niz sirovih podataka u čitljive izvještaje u nekoliko sekundi.
U ovom vodiču ćemo pogledati kako rotirati tablice u R-u i pretvoriti ih iz širokog u dugi format i obrnuto.
Veći dio lekcije posvećen je paketu tidyr i funkcije pivot_longer() и pivot_wider().
Lekcija 10: Učitavanje JSON datoteka u R i pretvaranje lista u tabele
Opis:
JSON i XML su izuzetno popularni formati za pohranjivanje i razmjenu informacija, obično zbog svoje kompaktnosti.
No, teško je analizirati podatke predstavljene u takvim formatima, pa ih je prije analize potrebno dovesti u tabelarni oblik, što ćemo upravo naučiti u ovom videu.
Lekcija je posvećena paketu tidyr, uključena u jezgro biblioteke tidyverse, i funkcije unnest_longer(), unnest_wider() и hoist().
Opis:
Lekcija pokazuje punu snagu paketa ggplot2 i gramatiku građenja grafova u slojevima koji su ugrađeni u njega.
Analizirat ćemo glavne geometrije koje su prisutne u paketu i naučiti kako primijeniti slojeve za izradu grafa.
zaključak
Pokušao sam da pristupim formiranju programa kursa što je moguće konciznije, da istaknem samo najneophodnije informacije koje će vam trebati da napravite prve korake u učenju tako moćnog alata za analizu podataka kao što je R jezik.
Kurs nije iscrpan vodič za analizu podataka koristeći R jezik, ali će vam pomoći da shvatite sve potrebne tehnike za to.
Dok je program kursa predviđen za 12 sedmica, svake sedmice ponedjeljkom otvaram pristup novim časovima, pa preporučujem pretplatite se na YouTube kanalu kako ne biste propustili objavljivanje nove lekcije.