Jezik R za uporabnike Excela (brezplačni video tečaj)

Mnogi zdaj zaradi karantene levji delež svojega časa preživijo doma in ta čas lahko in celo bi morali koristno preživeti.

Na začetku karantene sem se odločil dokončati nekaj projektov, ki sem jih začel pred nekaj meseci. Eden od teh projektov je bil video tečaj »R Language for Excel Users«. S tem tečajem sem želel znižati oviro za vstop v R in nekoliko zapolniti obstoječe pomanjkanje učnih gradiv na to temo v ruščini.

Če vse delo s podatki v podjetju, v katerem ste zaposleni, še vedno poteka v Excelu, potem vam predlagam, da se seznanite s sodobnejšim in hkrati popolnoma brezplačnim orodjem za analizo podatkov.

Jezik R za uporabnike Excela (brezplačni video tečaj)

Vsebina

Če vas zanima analiza podatkov, vas bo morda zanimal moj telegram и youtube kanalov. Večina vsebine je posvečena jeziku R.

  1. reference
  2. O tečaju
  3. Komu je ta tečaj namenjen?
  4. Program tečaja
    4.1. Lekcija 1: Namestitev jezika R in razvojnega okolja RStudio
    4.2. Lekcija 2: Osnovne podatkovne strukture v R
    4.3. Lekcija 3: Branje podatkov iz datotek TSV, CSV, Excel in Google Preglednic
    4.4. Lekcija 4: Filtriranje vrstic, izbiranje in preimenovanje stolpcev, cevovodi v R
    4.5. Lekcija 5: Dodajanje izračunanih stolpcev v tabelo v R
    4.6. Lekcija 6: Združevanje in združevanje podatkov v R
    4.7. Lekcija 7: Navpično in vodoravno spajanje tabel v R
    4.8. Lekcija 8: Okenske funkcije v R
    4.9. Lekcija 9: Rotirajoče tabele ali analogija vrtilnih tabel v R
    4.10. Lekcija 10: Nalaganje datotek JSON v R in pretvorba seznamov v tabele
    4.11. Lekcija 11: Hitro risanje s funkcijo qplot().
    4.12. Lekcija 12: Risanje plast za plastjo s paketom ggplot2
  5. Zaključek

reference

O tečaju

Tečaj je strukturiran okoli arhitekture tidyverse, in paketi, ki so vključeni v to: readr, vroom, dplyr, tidyr, ggplot2. Seveda obstajajo tudi drugi dobri paketi v R, ki na primer izvajajo podobne operacije data.table, ampak sintaksa tidyverse intuitiven, enostaven za branje tudi za neizkušenega uporabnika, zato menim, da je bolje začeti učenje jezika R z tidyverse.

Tečaj vas bo vodil skozi vse operacije analize podatkov, od nalaganja do vizualizacije končnega rezultata.

Zakaj R in ne Python? Ker je R funkcionalen jezik, uporabniki Excela lažje preidejo nanj, ker ni potrebe po poglabljanju v tradicionalno objektno orientirano programiranje.

Trenutno je predvidenih 12 video lekcij, ki trajajo od 5 do 20 minut.

Pouk se bo odpiral postopoma. Vsak ponedeljek bom odprl dostop do nove lekcije na svoji spletni strani. YouTube kanal na ločenem seznamu predvajanja.

Komu je ta tečaj namenjen?

Mislim, da je to jasno iz naslova, vendar ga bom podrobneje opisal.

Tečaj je namenjen tistim, ki pri svojem delu aktivno uporabljajo Microsoft Excel in tam izvajajo vse svoje delo s podatki. Na splošno velja, da če aplikacijo Microsoft Excel odprete vsaj enkrat na teden, potem je tečaj primeren za vas.

Za dokončanje tečaja vam ni potrebno znanje programiranja, ker ... Tečaj je namenjen začetnikom.

Morda pa bo od 4. lekcije naprej zanimivo gradivo tudi za aktivne uporabnike R, ker ... glavna funkcionalnost takih paketov, kot je dplyr и tidyr bomo obravnavali nekoliko podrobneje.

Program tečaja

Lekcija 1: Namestitev jezika R in razvojnega okolja RStudio

Datum objave: Marec 23 2020

Reference:

Video:

Opis:
Uvodna lekcija, v kateri bomo prenesli in namestili potrebno programsko opremo ter na kratko preučili zmožnosti in vmesnik razvojnega okolja RStudio.

Lekcija 2: Osnovne podatkovne strukture v R

Datum objave: Marec 30 2020

Reference:

Video:

Opis:
Ta lekcija vam bo pomagala razumeti, katere podatkovne strukture so na voljo v jeziku R. Podrobno si bomo ogledali vektorje, datumske okvire in sezname. Naučimo se, kako jih ustvariti in dostopati do njihovih posameznih elementov.

Lekcija 3: Branje podatkov iz datotek TSV, CSV, Excel in Google Preglednic

Datum objave: April 6 2020

Reference:

Video:

Opis:
Delo s podatki se ne glede na orodje začne z njihovim ekstrakcijo. Paketi se uporabljajo med poukom vroom, readxl, googlesheets4 za nalaganje podatkov v okolje R iz datotek csv, tsv, Excel in Google Preglednic.

Lekcija 4: Filtriranje vrstic, izbiranje in preimenovanje stolpcev, cevovodi v R

Datum objave: April 13 2020

Reference:

Video:

Opis:
Ta lekcija govori o paketu dplyr. V njej bomo ugotovili, kako filtrirati podatkovne okvire, izbrati potrebne stolpce in jih preimenovati.

Izvedeli bomo tudi, kaj so cevovodi in kako pomagajo narediti kodo R bolj berljivo.

Lekcija 5: Dodajanje izračunanih stolpcev v tabelo v R

Datum objave: April 20 2020

Reference:

Video:

Opis:
V tem videu nadaljujemo naše spoznavanje knjižnice tidyverse in paket dplyr.
Poglejmo družino funkcij mutate()in naučili se bomo, kako jih uporabiti za dodajanje novih izračunanih stolpcev v tabelo.

Lekcija 6: Združevanje in združevanje podatkov v R

Datum objave: April 27 2020

Reference:

Video:

Opis:
Ta lekcija je posvečena eni od glavnih operacij analize, združevanja in združevanja podatkov. Med poukom bomo uporabljali paket dplyr in funkcije group_by() и summarise().

Ogledali si bomo celotno družino funkcij summarise(), tj. summarise(), summarise_if() и summarise_at().

Lekcija 7: Navpično in vodoravno spajanje tabel v R

Datum objave: Maj 4 2020

Reference:

Video:

Opis:
Ta lekcija vam bo pomagala razumeti operacije navpičnega in vodoravnega spajanja tabel.

Navpična unija je enakovredna operaciji UNION v jeziku poizvedb SQL.

Horizontalno združevanje uporabniki Excela bolj poznajo po funkciji VLOOKUP, v SQL pa tovrstne operacije izvaja operator JOIN.

Pri učni uri bomo rešili praktični problem, pri katerem bomo uporabljali pakete dplyr, readxl, tidyr и stringr.

Glavne funkcije, ki jih bomo upoštevali:

  • bind_rows() — navpično spajanje tabel
  • left_join() — vodoravno spajanje tabel
  • semi_join() - vključno z združevanjem tabel
  • anti_join() - ekskluzivno združevanje miz

Lekcija 8: Okenske funkcije v R

Datum objave: Maj 11 2020

Reference:

Opis:
Okenske funkcije so po pomenu podobne agregacijskim; kot vhod vzamejo tudi niz vrednosti in na njih izvajajo aritmetične operacije, vendar ne spremenijo števila vrstic v izhodnem rezultatu.

V tej vadnici nadaljujemo s preučevanjem paketa dplyr, in funkcije group_by(), mutate(), pa tudi nove cumsum(), lag(), lead() и arrange().

Lekcija 9: Rotirajoče tabele ali analogija vrtilnih tabel v R

Datum objave: Maj 18 2020

Reference:

Opis:
Večina uporabnikov Excela uporablja vrtilne tabele; to je priročno orodje, s katerim lahko niz neobdelanih podatkov spremenite v berljiva poročila v nekaj sekundah.

V tej vadnici si bomo ogledali, kako zasukati tabele v R in jih pretvoriti iz širokega v dolgi format in obratno.

Večji del lekcije je namenjen paketu tidyr in funkcije pivot_longer() и pivot_wider().

Lekcija 10: Nalaganje datotek JSON v R in pretvorba seznamov v tabele

Datum objave: Maj 25 2020

Reference:

Opis:
JSON in XML sta izjemno priljubljena formata za shranjevanje in izmenjavo informacij, običajno zaradi svoje kompaktnosti.

Vendar je podatke, predstavljene v takšnih oblikah, težko analizirati, zato jih je pred analizo potrebno spraviti v tabelarično obliko, o čemer se bomo naučili v tem videu.

Lekcija je namenjena paketu tidyr, vključena v jedro knjižnice tidyverse, in funkcije unnest_longer(), unnest_wider() и hoist().

Lekcija 11: Hitro risanje s funkcijo qplot().

Datum objave: Junij 1 2020

Reference:

Opis:
Paket ggplot2 je eno najbolj priljubljenih orodij za vizualizacijo podatkov ne le v R.

V tej lekciji se bomo naučili sestaviti preproste grafe s funkcijo qplot(), in analizirajmo vse njene argumente.

Lekcija 12: Risanje plast za plastjo s paketom ggplot2

Datum objave: Junij 8 2020

Reference:

Opis:
Lekcija prikazuje vso moč paketa ggplot2 in slovnico gradnje grafov v plasteh, vdelanih vanj.

Analizirali bomo glavne geometrije, ki so prisotne v paketu, in se naučili, kako uporabiti plasti za izgradnjo grafa.

Zaključek

K oblikovanju programa tečaja sem poskušal pristopiti čim bolj jedrnato, izpostaviti le najbolj potrebne informacije, ki jih boste potrebovali za prve korake pri učenju tako zmogljivega orodja za analizo podatkov, kot je jezik R.

Tečaj ni izčrpen vodnik za analizo podatkov z uporabo jezika R, vendar vam bo pomagal razumeti vse potrebne tehnike za to.

Medtem ko je program tečaja zasnovan za 12 tednov, bom vsak teden ob ponedeljkih odprl dostop do novih lekcij, zato priporočam naročite se na YouTube kanalu, da ne zamudite objave nove lekcije.

Vir: www.habr.com

Dodaj komentar