Mnogi zdaj zaradi karantene levji delež svojega časa preživijo doma in ta čas lahko in celo bi morali koristno preživeti.
Na začetku karantene sem se odločil dokončati nekaj projektov, ki sem jih začel pred nekaj meseci. Eden od teh projektov je bil video tečaj »R Language for Excel Users«. S tem tečajem sem želel znižati oviro za vstop v R in nekoliko zapolniti obstoječe pomanjkanje učnih gradiv na to temo v ruščini.
Če vse delo s podatki v podjetju, v katerem ste zaposleni, še vedno poteka v Excelu, potem vam predlagam, da se seznanite s sodobnejšim in hkrati popolnoma brezplačnim orodjem za analizo podatkov.

Vsebina
Če vas zanima analiza podatkov, vas bo morda zanimal moj и kanalov. Večina vsebine je posvečena jeziku R.
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
4.10.
4.11.
4.12.
reference
O tečaju
Tečaj je strukturiran okoli arhitekture tidyverse, in paketi, ki so vključeni v to: readr, vroom, dplyr, tidyr, ggplot2. Seveda obstajajo tudi drugi dobri paketi v R, ki na primer izvajajo podobne operacije data.table, ampak sintaksa tidyverse intuitiven, enostaven za branje tudi za neizkušenega uporabnika, zato menim, da je bolje začeti učenje jezika R z tidyverse.
Tečaj vas bo vodil skozi vse operacije analize podatkov, od nalaganja do vizualizacije končnega rezultata.
Zakaj R in ne Python? Ker je R funkcionalen jezik, uporabniki Excela lažje preidejo nanj, ker ni potrebe po poglabljanju v tradicionalno objektno orientirano programiranje.
Trenutno je predvidenih 12 video lekcij, ki trajajo od 5 do 20 minut.
Pouk se bo odpiral postopoma. Vsak ponedeljek bom odprl dostop do nove lekcije na svoji spletni strani. na ločenem seznamu predvajanja.
Komu je ta tečaj namenjen?
Mislim, da je to jasno iz naslova, vendar ga bom podrobneje opisal.
Tečaj je namenjen tistim, ki pri svojem delu aktivno uporabljajo Microsoft Excel in tam izvajajo vse svoje delo s podatki. Na splošno velja, da če aplikacijo Microsoft Excel odprete vsaj enkrat na teden, potem je tečaj primeren za vas.
Za dokončanje tečaja vam ni potrebno znanje programiranja, ker ... Tečaj je namenjen začetnikom.
Morda pa bo od 4. lekcije naprej zanimivo gradivo tudi za aktivne uporabnike R, ker ... glavna funkcionalnost takih paketov, kot je dplyr и tidyr bomo obravnavali nekoliko podrobneje.
Program tečaja
Lekcija 1: Namestitev jezika R in razvojnega okolja RStudio
Datum objave: Marec 23 2020
Reference:
Video:

Opis:
Uvodna lekcija, v kateri bomo prenesli in namestili potrebno programsko opremo ter na kratko preučili zmožnosti in vmesnik razvojnega okolja RStudio.
Lekcija 2: Osnovne podatkovne strukture v R
Datum objave: Marec 30 2020
Reference:
Video:

Opis:
Ta lekcija vam bo pomagala razumeti, katere podatkovne strukture so na voljo v jeziku R. Podrobno si bomo ogledali vektorje, datumske okvire in sezname. Naučimo se, kako jih ustvariti in dostopati do njihovih posameznih elementov.
Lekcija 3: Branje podatkov iz datotek TSV, CSV, Excel in Google Preglednic
Datum objave: April 6 2020
Reference:
Video:

Opis:
Delo s podatki se ne glede na orodje začne z njihovim ekstrakcijo. Paketi se uporabljajo med poukom vroom, readxl, googlesheets4 za nalaganje podatkov v okolje R iz datotek csv, tsv, Excel in Google Preglednic.
Lekcija 4: Filtriranje vrstic, izbiranje in preimenovanje stolpcev, cevovodi v R
Datum objave: April 13 2020
Reference:
Video:

Opis:
Ta lekcija govori o paketu dplyr. V njej bomo ugotovili, kako filtrirati podatkovne okvire, izbrati potrebne stolpce in jih preimenovati.
Izvedeli bomo tudi, kaj so cevovodi in kako pomagajo narediti kodo R bolj berljivo.
Lekcija 5: Dodajanje izračunanih stolpcev v tabelo v R
Datum objave: April 20 2020
Reference:
Video:

Opis:
V tem videu nadaljujemo naše spoznavanje knjižnice tidyverse in paket dplyr.
Poglejmo družino funkcij mutate()in naučili se bomo, kako jih uporabiti za dodajanje novih izračunanih stolpcev v tabelo.
Lekcija 6: Združevanje in združevanje podatkov v R
Datum objave: April 27 2020
Reference:
Video:

Opis:
Ta lekcija je posvečena eni od glavnih operacij analize, združevanja in združevanja podatkov. Med poukom bomo uporabljali paket dplyr in funkcije group_by() и summarise().
Ogledali si bomo celotno družino funkcij summarise(), tj. summarise(), summarise_if() и summarise_at().
Lekcija 7: Navpično in vodoravno spajanje tabel v R
Datum objave: Maj 4 2020
Reference:
Video:

Opis:
Ta lekcija vam bo pomagala razumeti operacije navpičnega in vodoravnega spajanja tabel.
Navpična unija je enakovredna operaciji UNION v jeziku poizvedb SQL.
Horizontalno združevanje uporabniki Excela bolj poznajo po funkciji VLOOKUP, v SQL pa tovrstne operacije izvaja operator JOIN.
Pri učni uri bomo rešili praktični problem, pri katerem bomo uporabljali pakete dplyr, readxl, tidyr и stringr.
Glavne funkcije, ki jih bomo upoštevali:
bind_rows()— navpično spajanje tabelleft_join()— vodoravno spajanje tabelsemi_join()- vključno z združevanjem tabelanti_join()- ekskluzivno združevanje miz
Lekcija 8: Okenske funkcije v R
Datum objave: Maj 11 2020
Reference:
Opis:
Okenske funkcije so po pomenu podobne agregacijskim; kot vhod vzamejo tudi niz vrednosti in na njih izvajajo aritmetične operacije, vendar ne spremenijo števila vrstic v izhodnem rezultatu.
V tej vadnici nadaljujemo s preučevanjem paketa dplyr, in funkcije group_by(), mutate(), pa tudi nove cumsum(), lag(), lead() и arrange().
Lekcija 9: Rotirajoče tabele ali analogija vrtilnih tabel v R
Datum objave: Maj 18 2020
Reference:
Opis:
Večina uporabnikov Excela uporablja vrtilne tabele; to je priročno orodje, s katerim lahko niz neobdelanih podatkov spremenite v berljiva poročila v nekaj sekundah.
V tej vadnici si bomo ogledali, kako zasukati tabele v R in jih pretvoriti iz širokega v dolgi format in obratno.
Večji del lekcije je namenjen paketu tidyr in funkcije pivot_longer() и pivot_wider().
Lekcija 10: Nalaganje datotek JSON v R in pretvorba seznamov v tabele
Datum objave: Maj 25 2020
Reference:
Opis:
JSON in XML sta izjemno priljubljena formata za shranjevanje in izmenjavo informacij, običajno zaradi svoje kompaktnosti.
Vendar je podatke, predstavljene v takšnih oblikah, težko analizirati, zato jih je pred analizo potrebno spraviti v tabelarično obliko, o čemer se bomo naučili v tem videu.
Lekcija je namenjena paketu tidyr, vključena v jedro knjižnice tidyverse, in funkcije unnest_longer(), unnest_wider() и hoist().
Lekcija 11: Hitro risanje s funkcijo qplot().
Datum objave: Junij 1 2020
Reference:
Opis:
Paket ggplot2 je eno najbolj priljubljenih orodij za vizualizacijo podatkov ne le v R.
V tej lekciji se bomo naučili sestaviti preproste grafe s funkcijo qplot(), in analizirajmo vse njene argumente.
Lekcija 12: Risanje plast za plastjo s paketom ggplot2
Datum objave: Junij 8 2020
Reference:
Opis:
Lekcija prikazuje vso moč paketa ggplot2 in slovnico gradnje grafov v plasteh, vdelanih vanj.
Analizirali bomo glavne geometrije, ki so prisotne v paketu, in se naučili, kako uporabiti plasti za izgradnjo grafa.
Zaključek
K oblikovanju programa tečaja sem poskušal pristopiti čim bolj jedrnato, izpostaviti le najbolj potrebne informacije, ki jih boste potrebovali za prve korake pri učenju tako zmogljivega orodja za analizo podatkov, kot je jezik R.
Tečaj ni izčrpen vodnik za analizo podatkov z uporabo jezika R, vendar vam bo pomagal razumeti vse potrebne tehnike za to.
Medtem ko je program tečaja zasnovan za 12 tednov, bom vsak teden ob ponedeljkih odprl dostop do novih lekcij, zato priporočam na YouTube kanalu, da ne zamudite objave nove lekcije.
Vir: www.habr.com
