R-keel Exceli kasutajatele (tasuta videokursus)

Karantiini tõttu veedavad paljud nüüd lõviosa oma ajast kodus ning seda aega saab ja isegi tuleks kasulikult veeta.

Karantiini alguses otsustasin lõpetada mõned paar kuud tagasi alustatud projektid. Üks neist projektidest oli videokursus “R keel Exceli kasutajatele”. Selle kursusega soovisin langetada barjääri R-i sisenemisel ja veidi täita olemasolevat venekeelsete selleteemaliste koolitusmaterjalide puudust.

Kui kogu töö andmetega ettevõttes, kus töötate, tehakse ikkagi Excelis, siis soovitan tutvuda moodsama ja samas täiesti tasuta andmeanalüüsi tööriistaga.

R-keel Exceli kasutajatele (tasuta videokursus)

Sisu

Kui olete huvitatud andmete analüüsist, võite olla huvitatud minu telegramm и youtube kanalid. Suurem osa sisust on pühendatud R-keelele.

  1. Viited
  2. Kursuse kohta
  3. Kellele see kursus on mõeldud?
  4. Kursuse programm
    4.1. 1. õppetund: R-keele ja RStudio arenduskeskkonna installimine
    4.2. 2. õppetund: R põhilised andmestruktuurid
    4.3. 3. õppetund: andmete lugemine TSV-, CSV-, Excel-failidest ja Google'i arvutustabelitest
    4.4. 4. õppetund: ridade filtreerimine, veergude, torujuhtmete valimine ja ümbernimetamine R-is
    4.5. 5. õppetund: arvutatud veergude lisamine tabelisse R
    4.6. 6. õppetund: R-is andmete rühmitamine ja koondamine
    4.7. 7. õppetund: R tabelite vertikaalne ja horisontaalne ühendamine
    4.8. 8. õppetund: R-i aknafunktsioonid
    4.9. 9. õppetund: Pöörlevad tabelid või pöördetabelite analoog R-s
    4.10. 10. õppetund: JSON-failide laadimine R-is ja loendite teisendamine tabeliteks
    4.11. 11. õppetund: Kiire joonistamine Funktsiooni qplot() abil
    4.12. 12. õppetund: kihtide kaupa joonistamine, kasutades paketti ggplot2
  5. Järeldus

Viited

Kursuse kohta

Kursus on üles ehitatud arhitektuurile tidyverseja selles sisalduvad paketid: readr, vroom, dplyr, tidyr, ggplot2. Muidugi on R-s ka teisi häid pakette, mis teevad sarnaseid toiminguid näiteks data.table, vaid süntaks tidyverse intuitiivne, kergesti loetav isegi koolitamata kasutajale, seega arvan, et parem on alustada R-keele õppimist tidyverse.

Kursus juhendab teid läbi kõigi andmeanalüüsi toimingute laadimisest kuni valmis tulemuse visualiseerimiseni.

Miks R ja mitte Python? Kuna R on funktsionaalne keel, on Exceli kasutajatel lihtsam sellele lülituda, kuna pole vaja süveneda traditsioonilisse objektorienteeritud programmeerimisse.

Hetkel on kavas 12 videotundi, igaüks kestusega 5-20 minutit.

Tunnid avatakse järk-järgult. Igal esmaspäeval avan oma veebisaidil juurdepääsu uuele õppetunnile. YouTube'i kanal eraldi esitusloendis.

Kellele see kursus on mõeldud?

Ma arvan, et see selgub pealkirjast, kuid kirjeldan seda üksikasjalikumalt.

Kursus on suunatud neile, kes kasutavad aktiivselt oma töös Microsoft Excelit ja rakendavad seal kogu oma tööd andmetega. Üldjuhul, kui avate Microsoft Exceli rakenduse vähemalt kord nädalas, siis kursus sobib teile.

Kursuse läbimiseks ei nõuta programmeerimisoskust, sest... Kursus on suunatud algajatele.

Aga võib-olla on alates 4. õppetunnist huvitavat materjali ka aktiivsetele R-kasutajatele, sest... selliste pakettide põhifunktsioonid nagu dplyr и tidyr arutatakse üksikasjalikult.

Kursuse programm

1. õppetund: R-keele ja RStudio arenduskeskkonna installimine

Avaldamise kuupäev: Märts 23 2020

Lingid:

Video:

Kirjeldus:
Sissejuhatav tund, mille käigus laadime alla ja installime vajaliku tarkvara ning tutvume põgusalt RStudio arenduskeskkonna võimalustega ja liidesega.

2. õppetund: R põhilised andmestruktuurid

Avaldamise kuupäev: Märts 30 2020

Lingid:

Video:

Kirjeldus:
See õppetund aitab teil mõista, millised andmestruktuurid on R-keeles saadaval. Vaatleme üksikasjalikult vektoreid, kuupäevaraame ja loendeid. Õpime neid looma ja nende üksikutele elementidele juurde pääsema.

3. õppetund: andmete lugemine TSV-, CSV-, Excel-failidest ja Google'i arvutustabelitest

Avaldamise kuupäev: Aprill 6 2020

Lingid:

Video:

Kirjeldus:
Töö andmetega, olenemata tööriistast, algab nende ekstraheerimisest. Tunnis kasutatakse pakette vroom, readxl, googlesheets4 andmete laadimiseks R keskkonda csv, tsv, Exceli failidest ja Google Sheetsidest.

4. õppetund: ridade filtreerimine, veergude, torujuhtmete valimine ja ümbernimetamine R-is

Avaldamise kuupäev: Aprill 13 2020

Lingid:

Video:

Kirjeldus:
See õppetund käsitleb paketti dplyr. Selles selgitame välja, kuidas andmekaare filtreerida, valida vajalikud veerud ja nimetada need ümber.

Samuti õpime, mis on torujuhtmed ja kuidas need aitavad teie R-koodi loetavamaks muuta.

5. õppetund: arvutatud veergude lisamine tabelisse R

Avaldamise kuupäev: Aprill 20 2020

Lingid:

Video:

Kirjeldus:
Selles videos jätkame tutvust raamatukoguga tidyverse ja pakend dplyr.
Vaatame funktsioonide perekonda mutate()ja õpime, kuidas neid tabelisse uute arvutatud veergude lisamiseks kasutada.

6. õppetund: R-is andmete rühmitamine ja koondamine

Avaldamise kuupäev: Aprill 27 2020

Lingid:

Video:

Kirjeldus:
See õppetund on pühendatud andmete analüüsi, rühmitamise ja koondamise ühele põhitoimingule. Tunnis kasutame paketti dplyr ja funktsioonid group_by() и summarise().

Vaatleme kogu funktsioonide perekonda summarise()s.t. summarise(), summarise_if() и summarise_at().

7. õppetund: R tabelite vertikaalne ja horisontaalne ühendamine

Avaldamise kuupäev: Mai 4 2020

Lingid:

Video:

Kirjeldus:
See õppetund aitab teil mõista tabelite vertikaalse ja horisontaalse ühendamise toiminguid.

Vertikaalne liit on SQL-päringukeele operatsiooni UNION ekvivalent.

Horisontaalne liitumine on Exceli kasutajatele paremini tuntud tänu funktsioonile VLOOKUP, SQL-is teeb selliseid toiminguid operaator JOIN.

Tunnis lahendame praktilise ülesande, mille käigus kasutame pakette dplyr, readxl, tidyr и stringr.

Peamised funktsioonid, mida me kaalume:

  • bind_rows() - laudade vertikaalne ühendamine
  • left_join() — laudade horisontaalne ühendamine
  • semi_join() - sealhulgas ühenduslauad
  • anti_join() - eksklusiivne lauaühendus

8. õppetund: R-i aknafunktsioonid

Avaldamise kuupäev: Mai 11 2020

Lingid:

Kirjeldus:
Aknafunktsioonid on oma tähenduselt sarnased koondamisfunktsioonidele; nad võtavad sisendiks ka väärtuste massiivi ja teevad nendega aritmeetilisi toiminguid, kuid ei muuda väljundtulemuse ridade arvu.

Selles õpetuses jätkame paketi uurimist dplyrja funktsioonid group_by(), mutate(), kui ka uus cumsum(), lag(), lead() и arrange().

9. õppetund: Pöörlevad tabelid või pöördetabelite analoog R-s

Avaldamise kuupäev: Mai 18 2020

Lingid:

Kirjeldus:
Enamik Exceli kasutajaid kasutab pivot-tabeleid; see on mugav tööriist, mille abil saate muuta toorandmete massiivi loetavateks aruanneteks mõne sekundiga.

Selles õpetuses vaatleme, kuidas tabeleid R-vormingus pöörata ja teisendada laiformaadist pikaks ja vastupidi.

Suurem osa tunnist on pühendatud paketile tidyr ja funktsioone pivot_longer() и pivot_wider().

10. õppetund: JSON-failide laadimine R-is ja loendite teisendamine tabeliteks

Avaldamise kuupäev: Mai 25 2020

Lingid:

Kirjeldus:
JSON ja XML on äärmiselt populaarsed vormingud teabe salvestamiseks ja vahetamiseks, tavaliselt nende kompaktsuse tõttu.

Kuid sellistes vormingutes esitatud andmeid on raske analüüsida, nii et enne analüüsi tuleb need viia tabeli kujul, mida me sellest videost täpselt õpime.

Tund on pühendatud paketile tidyr, mis sisaldub raamatukogu tuumas tidyverseja funktsioonid unnest_longer(), unnest_wider() и hoist().

11. õppetund: Kiire joonistamine Funktsiooni qplot() abil

Avaldamise kuupäev: Juuni 1 2020

Lingid:

Kirjeldus:
Pakk ggplot2 on üks populaarsemaid andmete visualiseerimise tööriistu mitte ainult R.

Selles õppetükis õpime funktsiooni abil lihtsaid graafikuid koostama qplot()ja analüüsime kõiki tema argumente.

12. õppetund: kihtide kaupa joonistamine, kasutades paketti ggplot2

Avaldamise kuupäev: Juuni 8 2020

Lingid:

Kirjeldus:
Õppetund demonstreerib paketi kogu võimsust ggplot2 ja sellesse manustatud kihtidena graafikute ehitamise grammatika.

Analüüsime paketis sisalduvaid peamisi geomeetriaid ja õpime, kuidas graafiku koostamiseks kihte rakendada.

Järeldus

Püüdsin läheneda kursuse programmi kujundamisele võimalikult lühidalt, tuua esile vaid kõige vajalikum info, mida läheb vaja, et teha esimesi samme sellise võimsa andmeanalüüsi tööriista nagu R-keele õppimisel.

Kursus ei ole ammendav juhend andmete analüüsiks R-keele abil, kuid see aitab mõista kõiki selleks vajalikke tehnikaid.

Kui kursuse programm on mõeldud 12 nädalaks, siis igal nädalal esmaspäeviti avan juurdepääsu uutele tundidele, seega soovitan tellima YouTube'i kanalil, et mitte jätta ilma uue õppetunni avaldamisest.

Allikas: www.habr.com

Lisa kommentaar