R jezik za korisnike programa Excel (besplatan video tečaj)

Zbog karantene mnogi sada lavovski dio vremena provode kod kuće, a to vrijeme mogu, pa i trebaju, provesti korisno.

Na početku karantene odlučio sam završiti neke projekte koje sam započeo prije nekoliko mjeseci. Jedan od tih projekata bio je videotečaj “R jezik za korisnike programa Excel”. Ovim sam tečajem želio smanjiti barijeru za ulazak u R i malo popuniti postojeći nedostatak materijala za obuku o ovoj temi na ruskom.

Ako se sav rad s podacima u tvrtki u kojoj radite još uvijek obavlja u Excelu, predlažem da se upoznate s modernijim, a ujedno potpuno besplatnim alatom za analizu podataka.

R jezik za korisnike programa Excel (besplatan video tečaj)

sadržaj

Ako vas zanima analiza podataka, možda će vas zanimati moja telegram и youtube kanala. Većina sadržaja posvećena je jeziku R.

  1. reference
  2. O tečaju
  3. Za koga je ovaj tečaj?
  4. Program tečaja
    4.1. Lekcija 1: Instalacija jezika R i razvojnog okruženja RStudio
    4.2. Lekcija 2: Osnovne strukture podataka u R
    4.3. Lekcija 3: Čitanje podataka iz TSV, CSV, Excel datoteka i Google tablica
    4.4. Lekcija 4: Filtriranje redaka, odabir i preimenovanje stupaca, cjevovoda u R
    4.5. Lekcija 5: Dodavanje izračunatih stupaca u tablicu u R
    4.6. Lekcija 6: Grupiranje i agregiranje podataka u R
    4.7. Lekcija 7: Vertikalno i vodoravno spajanje tablica u R
    4.8. Lekcija 8: Funkcije prozora u R
    4.9. Lekcija 9: Rotirajuće tablice ili analogija zaokretnih tablica u R
    4.10. Lekcija 10: Učitavanje JSON datoteka u R i pretvaranje popisa u tablice
    4.11. Lekcija 11: Brzo crtanje pomoću funkcije qplot().
    4.12. Lekcija 12: Crtanje sloj po sloj crteža pomoću paketa ggplot2
  5. Zaključak

reference

O tečaju

Tečaj je strukturiran oko arhitekture tidyverse, i paketi uključeni u njega: readr, vroom, dplyr, tidyr, ggplot2. Naravno, postoje i drugi dobri paketi u R-u koji izvode slične operacije, na primjer data.table, ali sintaksa tidyverse intuitivan, lak za čitanje čak i neobučenom korisniku, pa mislim da je bolje započeti učenje R jezika s tidyverse.

Tečaj će vas voditi kroz sve operacije analize podataka, od učitavanja do vizualizacije gotovog rezultata.

Zašto R, a ne Python? Budući da je R funkcionalni jezik, korisnicima programa Excel lakše je prijeći na njega jer nema potrebe ulaziti u tradicionalno objektno orijentirano programiranje.

Trenutno je planirano 12 video lekcija u trajanju od 5 do 20 minuta.

Lekcije će se otvarati postupno. Svakog ponedjeljka otvorit ću pristup novoj lekciji na svojoj web stranici. YouTube kanal na zasebnoj listi za reprodukciju.

Za koga je ovaj tečaj?

Mislim da je to jasno iz naslova, međutim, opisat ću ga detaljnije.

Tečaj je namijenjen onima koji aktivno koriste Microsoft Excel u svom radu i u njemu implementiraju sav svoj rad s podacima. Općenito, ako barem jednom tjedno otvorite aplikaciju Microsoft Excel, onda je tečaj prikladan za vas.

Za završetak tečaja nije potrebno imati vještine programiranja jer... Tečaj je namijenjen početnicima.

No, možda će, počevši od lekcije 4, biti zanimljivog materijala i za aktivne R korisnike, jer... glavne funkcije takvih paketa kao što su dplyr и tidyr raspravljat će se ponešto detaljnije.

Program tečaja

Lekcija 1: Instalacija jezika R i razvojnog okruženja RStudio

Datum objave: Ožujak 23 2020

reference:

Video:

Opis:
Uvodna lekcija tijekom koje ćemo preuzeti i instalirati potreban softver, te ukratko ispitati mogućnosti i sučelje razvojnog okruženja RStudio.

Lekcija 2: Osnovne strukture podataka u R

Datum objave: Ožujak 30 2020

reference:

Video:

Opis:
Ova lekcija će vam pomoći razumjeti koje su strukture podataka dostupne u jeziku R. Detaljno ćemo pogledati vektore, datumske okvire i popise. Naučimo kako ih izraditi i pristupiti njihovim pojedinačnim elementima.

Lekcija 3: Čitanje podataka iz TSV, CSV, Excel datoteka i Google tablica

Datum objave: Travnja 6 2020

reference:

Video:

Opis:
Rad s podacima, bez obzira na alat, počinje njihovim izdvajanjem. Paketi se koriste tijekom nastave vroom, readxl, googlesheets4 za učitavanje podataka u R okruženje iz csv, tsv, Excel datoteka i Google tablica.

Lekcija 4: Filtriranje redaka, odabir i preimenovanje stupaca, cjevovoda u R

Datum objave: Travnja 13 2020

reference:

Video:

Opis:
Ova lekcija govori o paketu dplyr. U njemu ćemo otkriti kako filtrirati podatkovne okvire, odabrati potrebne stupce i preimenovati ih.

Također ćemo naučiti što su cjevovodi i kako pomažu da vaš R kod bude čitljiviji.

Lekcija 5: Dodavanje izračunatih stupaca u tablicu u R

Datum objave: Travnja 20 2020

reference:

Video:

Opis:
U ovom videu nastavljamo naše upoznavanje s knjižnicom tidyverse i paket dplyr.
Pogledajmo obitelj funkcija mutate(), a mi ćemo naučiti kako ih koristiti za dodavanje novih izračunatih stupaca u tablicu.

Lekcija 6: Grupiranje i agregiranje podataka u R

Datum objave: Travnja 27 2020

reference:

Video:

Opis:
Ova lekcija posvećena je jednoj od glavnih operacija analize, grupiranja i agregacije podataka. Tijekom lekcije koristit ćemo paket dplyr i značajke group_by() и summarise().

Pogledat ćemo cijelu obitelj funkcija summarise(), tj summarise(), summarise_if() и summarise_at().

Lekcija 7: Vertikalno i vodoravno spajanje tablica u R

Datum objave: Svibanj 4 2020

reference:

Video:

Opis:
Ova lekcija pomoći će vam razumjeti operacije okomitog i vodoravnog spajanja tablica.

Vertikalna unija je ekvivalent operacije UNION u jeziku upita SQL.

Horizontalno spajanje je poznatije korisnicima programa Excel zahvaljujući funkciji VLOOKUP, dok u SQL-u takve operacije izvodi operator JOIN.

Na satu ćemo riješiti praktični zadatak tijekom kojeg ćemo koristiti pakete dplyr, readxl, tidyr и stringr.

Glavne funkcije koje ćemo razmotriti:

  • bind_rows() - okomito spajanje tablica
  • left_join() — vodoravno spajanje tablica
  • semi_join() - uključujući spajanje tablica
  • anti_join() - ekskluzivno spajanje stolova

Lekcija 8: Funkcije prozora u R

Datum objave: Svibanj 11 2020

reference:

Opis:
Funkcije prozora po značenju su slične onima za agregiranje; one također uzimaju niz vrijednosti kao ulaz i izvode aritmetičke operacije na njima, ali ne mijenjaju broj redaka u izlaznom rezultatu.

U ovom vodiču nastavljamo proučavati paket dplyr, i funkcije group_by(), mutate(), kao i novi cumsum(), lag(), lead() и arrange().

Lekcija 9: Rotirajuće tablice ili analogija zaokretnih tablica u R

Datum objave: Svibanj 18 2020

reference:

Opis:
Većina korisnika programa Excel koristi zaokretne tablice; ovo je praktičan alat s kojim niz neobrađenih podataka možete pretvoriti u čitljiva izvješća u nekoliko sekundi.

U ovom vodiču ćemo pogledati kako rotirati tablice u R-u i pretvoriti ih iz širokog u dugi format i obrnuto.

Većina lekcije posvećena je paketu tidyr i funkcije pivot_longer() и pivot_wider().

Lekcija 10: Učitavanje JSON datoteka u R i pretvaranje popisa u tablice

Datum objave: Svibanj 25 2020

reference:

Opis:
JSON i XML iznimno su popularni formati za pohranu i razmjenu informacija, najčešće zbog svoje kompaktnosti.

No podatke prikazane u takvim formatima teško je analizirati, pa ih je prije analize potrebno dovesti u tabelarnu formu, a upravo to ćemo naučiti u ovom videu.

Lekcija je posvećena paketu tidyr, uvršten u jezgru knjižnice tidyverse, i funkcije unnest_longer(), unnest_wider() и hoist().

Lekcija 11: Brzo crtanje pomoću funkcije qplot().

Datum objave: Lipnja 1 2020

reference:

Opis:
paket ggplot2 je jedan od najpopularnijih alata za vizualizaciju podataka ne samo u R.

U ovoj lekciji naučit ćemo kako izgraditi jednostavne grafikone pomoću funkcije qplot(), i analizirajmo sve njene argumente.

Lekcija 12: Crtanje sloj po sloj crteža pomoću paketa ggplot2

Datum objave: Lipnja 8 2020

reference:

Opis:
Lekcija pokazuje svu snagu paketa ggplot2 i gramatika izgradnje grafova u slojevima ugrađenim u njega.

Analizirat ćemo glavne geometrije koje su prisutne u paketu i naučiti kako primijeniti slojeve za izradu grafikona.

Zaključak

Formiranju programa tečaja nastojao sam pristupiti što konciznije, istaknuti samo najnužnije informacije koje će vam trebati za prve korake u učenju tako moćnog alata za analizu podataka kao što je R jezik.

Tečaj nije iscrpan vodič za analizu podataka pomoću jezika R, ali će vam pomoći da razumijete sve potrebne tehnike za to.

Iako je program tečaja osmišljen za 12 tjedana, svaki tjedan ponedjeljkom otvorit ću pristup novim lekcijama, stoga preporučujem pretplatiti na YouTube kanalu kako ne biste propustili objavu nove lekcije.

Izvor: www.habr.com

Dodajte komentar