Zbog karantene mnogi sada lavovski dio vremena provode kod kuće, a to vrijeme mogu, pa i trebaju, provesti korisno.
Na početku karantene odlučio sam završiti neke projekte koje sam započeo prije nekoliko mjeseci. Jedan od tih projekata bio je videotečaj “R jezik za korisnike programa Excel”. Ovim sam tečajem želio smanjiti barijeru za ulazak u R i malo popuniti postojeći nedostatak materijala za obuku o ovoj temi na ruskom.
Ako se sav rad s podacima u tvrtki u kojoj radite još uvijek obavlja u Excelu, predlažem da se upoznate s modernijim, a ujedno potpuno besplatnim alatom za analizu podataka.

sadržaj
Ako vas zanima analiza podataka, možda će vas zanimati moja и kanala. Većina sadržaja posvećena je jeziku R.
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
4.10.
4.11.
4.12.
reference
O tečaju
Tečaj je strukturiran oko arhitekture tidyverse, i paketi uključeni u njega: readr, vroom, dplyr, tidyr, ggplot2. Naravno, postoje i drugi dobri paketi u R-u koji izvode slične operacije, na primjer data.table, ali sintaksa tidyverse intuitivan, lak za čitanje čak i neobučenom korisniku, pa mislim da je bolje započeti učenje R jezika s tidyverse.
Tečaj će vas voditi kroz sve operacije analize podataka, od učitavanja do vizualizacije gotovog rezultata.
Zašto R, a ne Python? Budući da je R funkcionalni jezik, korisnicima programa Excel lakše je prijeći na njega jer nema potrebe ulaziti u tradicionalno objektno orijentirano programiranje.
Trenutno je planirano 12 video lekcija u trajanju od 5 do 20 minuta.
Lekcije će se otvarati postupno. Svakog ponedjeljka otvorit ću pristup novoj lekciji na svojoj web stranici. na zasebnoj listi za reprodukciju.
Za koga je ovaj tečaj?
Mislim da je to jasno iz naslova, međutim, opisat ću ga detaljnije.
Tečaj je namijenjen onima koji aktivno koriste Microsoft Excel u svom radu i u njemu implementiraju sav svoj rad s podacima. Općenito, ako barem jednom tjedno otvorite aplikaciju Microsoft Excel, onda je tečaj prikladan za vas.
Za završetak tečaja nije potrebno imati vještine programiranja jer... Tečaj je namijenjen početnicima.
No, možda će, počevši od lekcije 4, biti zanimljivog materijala i za aktivne R korisnike, jer... glavne funkcije takvih paketa kao što su dplyr и tidyr raspravljat će se ponešto detaljnije.
Program tečaja
Lekcija 1: Instalacija jezika R i razvojnog okruženja RStudio
Datum objave: Ožujak 23 2020
reference:
Video:

Opis:
Uvodna lekcija tijekom koje ćemo preuzeti i instalirati potreban softver, te ukratko ispitati mogućnosti i sučelje razvojnog okruženja RStudio.
Lekcija 2: Osnovne strukture podataka u R
Datum objave: Ožujak 30 2020
reference:
Video:

Opis:
Ova lekcija će vam pomoći razumjeti koje su strukture podataka dostupne u jeziku R. Detaljno ćemo pogledati vektore, datumske okvire i popise. Naučimo kako ih izraditi i pristupiti njihovim pojedinačnim elementima.
Lekcija 3: Čitanje podataka iz TSV, CSV, Excel datoteka i Google tablica
Datum objave: Travnja 6 2020
reference:
Video:

Opis:
Rad s podacima, bez obzira na alat, počinje njihovim izdvajanjem. Paketi se koriste tijekom nastave vroom, readxl, googlesheets4 za učitavanje podataka u R okruženje iz csv, tsv, Excel datoteka i Google tablica.
Lekcija 4: Filtriranje redaka, odabir i preimenovanje stupaca, cjevovoda u R
Datum objave: Travnja 13 2020
reference:
Video:

Opis:
Ova lekcija govori o paketu dplyr. U njemu ćemo otkriti kako filtrirati podatkovne okvire, odabrati potrebne stupce i preimenovati ih.
Također ćemo naučiti što su cjevovodi i kako pomažu da vaš R kod bude čitljiviji.
Lekcija 5: Dodavanje izračunatih stupaca u tablicu u R
Datum objave: Travnja 20 2020
reference:
Video:

Opis:
U ovom videu nastavljamo naše upoznavanje s knjižnicom tidyverse i paket dplyr.
Pogledajmo obitelj funkcija mutate(), a mi ćemo naučiti kako ih koristiti za dodavanje novih izračunatih stupaca u tablicu.
Lekcija 6: Grupiranje i agregiranje podataka u R
Datum objave: Travnja 27 2020
reference:
Video:

Opis:
Ova lekcija posvećena je jednoj od glavnih operacija analize, grupiranja i agregacije podataka. Tijekom lekcije koristit ćemo paket dplyr i značajke group_by() и summarise().
Pogledat ćemo cijelu obitelj funkcija summarise(), tj summarise(), summarise_if() и summarise_at().
Lekcija 7: Vertikalno i vodoravno spajanje tablica u R
Datum objave: Svibanj 4 2020
reference:
Video:

Opis:
Ova lekcija pomoći će vam razumjeti operacije okomitog i vodoravnog spajanja tablica.
Vertikalna unija je ekvivalent operacije UNION u jeziku upita SQL.
Horizontalno spajanje je poznatije korisnicima programa Excel zahvaljujući funkciji VLOOKUP, dok u SQL-u takve operacije izvodi operator JOIN.
Na satu ćemo riješiti praktični zadatak tijekom kojeg ćemo koristiti pakete dplyr, readxl, tidyr и stringr.
Glavne funkcije koje ćemo razmotriti:
bind_rows()- okomito spajanje tablicaleft_join()— vodoravno spajanje tablicasemi_join()- uključujući spajanje tablicaanti_join()- ekskluzivno spajanje stolova
Lekcija 8: Funkcije prozora u R
Datum objave: Svibanj 11 2020
reference:
Opis:
Funkcije prozora po značenju su slične onima za agregiranje; one također uzimaju niz vrijednosti kao ulaz i izvode aritmetičke operacije na njima, ali ne mijenjaju broj redaka u izlaznom rezultatu.
U ovom vodiču nastavljamo proučavati paket dplyr, i funkcije group_by(), mutate(), kao i novi cumsum(), lag(), lead() и arrange().
Lekcija 9: Rotirajuće tablice ili analogija zaokretnih tablica u R
Datum objave: Svibanj 18 2020
reference:
Opis:
Većina korisnika programa Excel koristi zaokretne tablice; ovo je praktičan alat s kojim niz neobrađenih podataka možete pretvoriti u čitljiva izvješća u nekoliko sekundi.
U ovom vodiču ćemo pogledati kako rotirati tablice u R-u i pretvoriti ih iz širokog u dugi format i obrnuto.
Većina lekcije posvećena je paketu tidyr i funkcije pivot_longer() и pivot_wider().
Lekcija 10: Učitavanje JSON datoteka u R i pretvaranje popisa u tablice
Datum objave: Svibanj 25 2020
reference:
Opis:
JSON i XML iznimno su popularni formati za pohranu i razmjenu informacija, najčešće zbog svoje kompaktnosti.
No podatke prikazane u takvim formatima teško je analizirati, pa ih je prije analize potrebno dovesti u tabelarnu formu, a upravo to ćemo naučiti u ovom videu.
Lekcija je posvećena paketu tidyr, uvršten u jezgru knjižnice tidyverse, i funkcije unnest_longer(), unnest_wider() и hoist().
Lekcija 11: Brzo crtanje pomoću funkcije qplot().
Datum objave: Lipnja 1 2020
reference:
Opis:
paket ggplot2 je jedan od najpopularnijih alata za vizualizaciju podataka ne samo u R.
U ovoj lekciji naučit ćemo kako izgraditi jednostavne grafikone pomoću funkcije qplot(), i analizirajmo sve njene argumente.
Lekcija 12: Crtanje sloj po sloj crteža pomoću paketa ggplot2
Datum objave: Lipnja 8 2020
reference:
Opis:
Lekcija pokazuje svu snagu paketa ggplot2 i gramatika izgradnje grafova u slojevima ugrađenim u njega.
Analizirat ćemo glavne geometrije koje su prisutne u paketu i naučiti kako primijeniti slojeve za izradu grafikona.
Zaključak
Formiranju programa tečaja nastojao sam pristupiti što konciznije, istaknuti samo najnužnije informacije koje će vam trebati za prve korake u učenju tako moćnog alata za analizu podataka kao što je R jezik.
Tečaj nije iscrpan vodič za analizu podataka pomoću jezika R, ali će vam pomoći da razumijete sve potrebne tehnike za to.
Iako je program tečaja osmišljen za 12 tjedana, svaki tjedan ponedjeljkom otvorit ću pristup novim lekcijama, stoga preporučujem na YouTube kanalu kako ne biste propustili objavu nove lekcije.
Izvor: www.habr.com
