R-kieli Excelin käyttäjille (ilmainen videokurssi)

Karanteenin vuoksi monet viettävät nyt leijonan osan ajastaan ​​kotona, ja tämän ajan voi, ja jopa pitäisi, käyttää hyödyllisesti.

Karanteenin alussa päätin saada päätökseen muutama kuukausi sitten aloittamani projekti. Yksi näistä projekteista oli videokurssi “R Language for Excel Users”. Tällä kurssilla halusin alentaa R:hen pääsyn estettä ja hieman täyttää olemassa olevaa pulaa venäjänkielisestä koulutusmateriaalista tästä aiheesta.

Jos kaikki työ datalla työskentelyssäsi yrityksessä tehdään edelleen Excelissä, niin suosittelen tutustumaan nykyaikaisempaan ja samalla täysin ilmaiseen data-analyysityökaluun.

R-kieli Excelin käyttäjille (ilmainen videokurssi)

Pitoisuus

Jos olet kiinnostunut data-analyysistä, saatat olla kiinnostunut minun sähke и youtube kanavia. Suurin osa sisällöstä on omistettu R-kielelle.

  1. viittaukset
  2. Tietoja kurssista
  3. Kenelle tämä kurssi on tarkoitettu?
  4. Kurssin ohjelma
    4.1. Oppitunti 1: R-kielen ja RStudio-kehitysympäristön asentaminen
    4.2. Oppitunti 2: R:n perustietorakenteet
    4.3. Oppitunti 3: Tietojen lukeminen TSV-, CSV-, Excel-tiedostoista ja Google-taulukoista
    4.4. Oppitunti 4: Rivien suodattaminen, sarakkeiden, liukuhihnan valitseminen ja uudelleennimeäminen R:ssä
    4.5. Oppitunti 5: Laskettujen sarakkeiden lisääminen taulukkoon R
    4.6. Oppitunti 6: Tietojen ryhmittely ja yhdistäminen R:ssä
    4.7. Oppitunti 7: Pöytien pysty- ja vaakasuora yhdistäminen R:ssä
    4.8. Oppitunti 8: Ikkunatoiminnot R:ssä
    4.9. Oppitunti 9: Pyörivät taulukot tai pivot-taulukoiden analogi R:ssä
    4.10. Oppitunti 10: JSON-tiedostojen lataaminen R:ssä ja luetteloiden muuntaminen taulukoiksi
    4.11. Oppitunti 11: Piirtäminen nopeasti qplot()-funktion avulla
    4.12. Oppitunti 12: Piirrä kerros kerrokselta piirroksia käyttämällä ggplot2-pakettia
  5. Johtopäätös

viittaukset

Tietoja kurssista

Kurssi rakentuu arkkitehtuurin ympärille tidyverseja siihen sisältyvät paketit: readr, vroom, dplyr, tidyr, ggplot2. Tietysti R:ssä on muitakin hyviä paketteja, jotka suorittavat esimerkiksi samanlaisia ​​toimintoja data.table, mutta syntaksi tidyverse intuitiivinen, helppolukuinen jopa kouluttamattomalle käyttäjälle, joten mielestäni on parempi aloittaa R-kielen oppiminen tidyverse.

Kurssi opastaa sinua kaikissa data-analyysioperaatioissa lataamisesta valmiin tuloksen visualisointiin.

Miksi R eikä Python? Koska R on toiminnallinen kieli, Excelin käyttäjien on helpompi vaihtaa siihen, koska ei tarvitse perehtyä perinteiseen olioohjelmointiin.

Tällä hetkellä suunnitteilla on 12 videotuntia, joista jokainen kestää 5-20 minuuttia.

Oppitunnit avautuvat vähitellen. Joka maanantai avaan pääsyn uudelle oppitunnille verkkosivustollani. YouTube-kanava erillisessä soittolistassa.

Kenelle tämä kurssi on tarkoitettu?

Mielestäni tämä käy selvästi ilmi otsikosta, mutta kuvailen sitä tarkemmin.

Kurssi on suunnattu niille, jotka käyttävät aktiivisesti Microsoft Exceliä työssään ja toteuttavat siellä kaiken työnsä datalla. Yleisesti ottaen, jos avaat Microsoft Excel -sovelluksen vähintään kerran viikossa, kurssi sopii sinulle.

Kurssin suorittaminen ei edellytä ohjelmointitaitoja, koska... Kurssi on suunnattu aloittelijoille.

Mutta kenties oppitunnilta 4 alkaen on mielenkiintoista materiaalia myös aktiivisille R-käyttäjille, koska... tällaisten pakettien päätoiminnot, kuten dplyr и tidyr keskustellaan yksityiskohtaisesti.

Kurssin ohjelma

Oppitunti 1: R-kielen ja RStudio-kehitysympäristön asentaminen

Julkaisupäivämäärä: Maaliskuuta 23 2020

viitteet:

Video:

Описание:
Alkutunti, jonka aikana lataamme ja asennamme tarvittavat ohjelmistot sekä tarkastellaan lyhyesti RStudio-kehitysympäristön ominaisuuksia ja käyttöliittymää.

Oppitunti 2: R:n perustietorakenteet

Julkaisupäivämäärä: Maaliskuuta 30 2020

viitteet:

Video:

Описание:
Tämä oppitunti auttaa sinua ymmärtämään, mitä tietorakenteita on saatavilla R-kielellä. Tarkastellaan yksityiskohtaisesti vektoreita, päivämääräkehyksiä ja listoja. Opitaan luomaan niitä ja käyttämään niiden yksittäisiä elementtejä.

Oppitunti 3: Tietojen lukeminen TSV-, CSV-, Excel-tiedostoista ja Google-taulukoista

Julkaisupäivämäärä: Huhtikuu 6 2020

viitteet:

Video:

Описание:
Tietojen käsittely työkalusta riippumatta alkaa sen poimimisesta. Paketteja käytetään tunnilla vroom, readxl, googlesheets4 tietojen lataamiseen R-ympäristöön csv-, tsv-, Excel-tiedostoista ja Google Sheetsistä.

Oppitunti 4: Rivien suodattaminen, sarakkeiden, liukuhihnan valitseminen ja uudelleennimeäminen R:ssä

Julkaisupäivämäärä: Huhtikuu 13 2020

viitteet:

Video:

Описание:
Tämä oppitunti käsittelee pakettia dplyr. Siinä selvitämme, kuinka tietokehykset suodatetaan, valitaan tarvittavat sarakkeet ja nimetään ne uudelleen.

Opimme myös, mitä liukuhihnat ovat ja kuinka ne auttavat tekemään R-koodistasi luettavamman.

Oppitunti 5: Laskettujen sarakkeiden lisääminen taulukkoon R

Julkaisupäivämäärä: Huhtikuu 20 2020

viitteet:

Video:

Описание:
Tällä videolla jatkamme tutustumista kirjastoon tidyverse ja paketti dplyr.
Katsotaanpa toimintoperhettä mutate(), ja opimme käyttämään niitä uusien laskettujen sarakkeiden lisäämiseen taulukkoon.

Oppitunti 6: Tietojen ryhmittely ja yhdistäminen R:ssä

Julkaisupäivämäärä: Huhtikuu 27 2020

viitteet:

Video:

Описание:
Tämä oppitunti on omistettu yhdelle tietojen analysoinnin, ryhmittelyn ja aggregoinnin päätoiminnoista. Oppitunnin aikana käytämme pakettia dplyr ja ominaisuuksia group_by() и summarise().

Tutustumme koko toimintoperheeseen summarise(), ts. summarise(), summarise_if() и summarise_at().

Oppitunti 7: Pöytien pysty- ja vaakasuora yhdistäminen R:ssä

Julkaisupäivämäärä: Toukokuuta 4 2020

viitteet:

Video:

Описание:
Tämä oppitunti auttaa sinua ymmärtämään taulukoiden pysty- ja vaakaliitostoiminnot.

Pystysuuntainen liitto vastaa UNION-toimintoa SQL-kyselykielessä.

Horisontaalinen liitos on Excel-käyttäjien tuttu paremmin VLOOKUP-toiminnon ansiosta, SQL:ssä tällaiset toiminnot suorittaa JOIN-operaattori.

Oppitunnilla ratkaisemme käytännön ongelman, jonka aikana käytämme paketteja dplyr, readxl, tidyr и stringr.

Tärkeimmät toiminnot, joita tarkastelemme:

  • bind_rows() - Pöytien pystysuora liitos
  • left_join() — taulukoiden vaakasuora liitos
  • semi_join() - mukaan lukien liitospöydät
  • anti_join() - ainutlaatuinen pöytäliitos

Oppitunti 8: Ikkunatoiminnot R:ssä

Julkaisupäivämäärä: Toukokuuta 11 2020

viitteet:

Описание:
Ikkunafunktiot ovat merkitykseltään samanlaisia ​​kuin aggregoivat; ne ottavat myös syötteenä joukon arvoja ja suorittavat niille aritmeettisia operaatioita, mutta eivät muuta rivien määrää tulostetussa tuloksessa.

Tässä opetusohjelmassa jatkamme paketin tutkimista dplyr, ja toiminnot group_by(), mutate(), sekä uusia cumsum(), lag(), lead() и arrange().

Oppitunti 9: Pyörivät taulukot tai pivot-taulukoiden analogi R:ssä

Julkaisupäivämäärä: Toukokuuta 18 2020

viitteet:

Описание:
Useimmat Excel-käyttäjät käyttävät pivot-taulukoita; tämä on kätevä työkalu, jolla voit muuntaa joukon raakadataa luettavissa oleviksi raporteiksi muutamassa sekunnissa.

Tässä opetusohjelmassa tarkastellaan taulukoiden kiertämistä R-kielellä ja niiden muuntamista leveästä pitkiin ja päinvastoin.

Suurin osa oppitunnista on omistettu paketille tidyr ja toiminnot pivot_longer() и pivot_wider().

Oppitunti 10: JSON-tiedostojen lataaminen R:ssä ja luetteloiden muuntaminen taulukoiksi

Julkaisupäivämäärä: Toukokuuta 25 2020

viitteet:

Описание:
JSON ja XML ovat äärimmäisen suosittuja formaatteja tietojen tallentamiseen ja vaihtamiseen, yleensä niiden kompaktin koon vuoksi.

Mutta tällaisissa muodoissa esitettyjä tietoja on vaikea analysoida, joten ennen analysointia on tarpeen tuoda se taulukkomuotoon, minkä opimme juuri tässä videossa.

Oppitunti on omistettu paketille tidyr, sisältyy kirjaston ytimeen tidyverse, ja toiminnot unnest_longer(), unnest_wider() и hoist().

Oppitunti 11: Piirtäminen nopeasti qplot()-funktion avulla

Julkaisupäivämäärä: Kesäkuu 1 2020

viitteet:

Описание:
paketti ggplot2 on yksi suosituimmista datan visualisointityökaluista paitsi R:ssä.

Tällä oppitunnilla opimme rakentamaan yksinkertaisia ​​kaavioita funktion avulla qplot(), ja analysoidaan kaikki hänen väitteensä.

Oppitunti 12: Piirrä kerros kerrokselta piirroksia käyttämällä ggplot2-pakettia

Julkaisupäivämäärä: Kesäkuu 8 2020

viitteet:

Описание:
Oppitunti osoittaa paketin täyden tehon ggplot2 ja kielioppi graafien rakentamiseen siihen upotettuihin tasoihin.

Analysoimme pakkauksessa olevat tärkeimmät geometriat ja opimme käyttämään tasoja kaavion rakentamiseen.

Johtopäätös

Yritin lähestyä kurssiohjelman muodostamista mahdollisimman ytimekkäästi, korostaakseen vain tarpeellisimmat tiedot, joita tarvitset ottaaksesi ensimmäiset askeleet sellaisen tehokkaan data-analyysityökalun kuin R-kielen oppimisessa.

Kurssi ei ole tyhjentävä opas tietojen analysointiin R-kielellä, mutta se auttaa sinua ymmärtämään kaikki tähän tarvittavat tekniikat.

Vaikka kurssiohjelma on suunniteltu 12 viikoksi, avaan joka viikko maanantaisin pääsyn uusille tunneille, joten suosittelen Merkitä YouTube-kanavalla, jotta et menetä uuden oppitunnin julkaisua.

Lähde: will.com

Lisää kommentti