Karanteenin vuoksi monet viettävät nyt leijonan osan ajastaan kotona, ja tämän ajan voi, ja jopa pitäisi, käyttää hyödyllisesti.
Karanteenin alussa päätin saada päätökseen muutama kuukausi sitten aloittamani projekti. Yksi näistä projekteista oli videokurssi “R Language for Excel Users”. Tällä kurssilla halusin alentaa R:hen pääsyn estettä ja hieman täyttää olemassa olevaa pulaa venäjänkielisestä koulutusmateriaalista tästä aiheesta.
Jos kaikki työ datalla työskentelyssäsi yrityksessä tehdään edelleen Excelissä, niin suosittelen tutustumaan nykyaikaisempaan ja samalla täysin ilmaiseen data-analyysityökaluun.
Pitoisuus
Jos olet kiinnostunut data-analyysistä, saatat olla kiinnostunut minun sähke и youtube kanavia. Suurin osa sisällöstä on omistettu R-kielelle.
Kurssi rakentuu arkkitehtuurin ympärille tidyverseja siihen sisältyvät paketit: readr, vroom, dplyr, tidyr, ggplot2. Tietysti R:ssä on muitakin hyviä paketteja, jotka suorittavat esimerkiksi samanlaisia toimintoja data.table, mutta syntaksi tidyverse intuitiivinen, helppolukuinen jopa kouluttamattomalle käyttäjälle, joten mielestäni on parempi aloittaa R-kielen oppiminen tidyverse.
Kurssi opastaa sinua kaikissa data-analyysioperaatioissa lataamisesta valmiin tuloksen visualisointiin.
Miksi R eikä Python? Koska R on toiminnallinen kieli, Excelin käyttäjien on helpompi vaihtaa siihen, koska ei tarvitse perehtyä perinteiseen olioohjelmointiin.
Tällä hetkellä suunnitteilla on 12 videotuntia, joista jokainen kestää 5-20 minuuttia.
Oppitunnit avautuvat vähitellen. Joka maanantai avaan pääsyn uudelle oppitunnille verkkosivustollani. YouTube-kanava erillisessä soittolistassa.
Kenelle tämä kurssi on tarkoitettu?
Mielestäni tämä käy selvästi ilmi otsikosta, mutta kuvailen sitä tarkemmin.
Kurssi on suunnattu niille, jotka käyttävät aktiivisesti Microsoft Exceliä työssään ja toteuttavat siellä kaiken työnsä datalla. Yleisesti ottaen, jos avaat Microsoft Excel -sovelluksen vähintään kerran viikossa, kurssi sopii sinulle.
Kurssin suorittaminen ei edellytä ohjelmointitaitoja, koska... Kurssi on suunnattu aloittelijoille.
Mutta kenties oppitunnilta 4 alkaen on mielenkiintoista materiaalia myös aktiivisille R-käyttäjille, koska... tällaisten pakettien päätoiminnot, kuten dplyr и tidyr keskustellaan yksityiskohtaisesti.
Kurssin ohjelma
Oppitunti 1: R-kielen ja RStudio-kehitysympäristön asentaminen
Описание:
Alkutunti, jonka aikana lataamme ja asennamme tarvittavat ohjelmistot sekä tarkastellaan lyhyesti RStudio-kehitysympäristön ominaisuuksia ja käyttöliittymää.
Описание:
Tämä oppitunti auttaa sinua ymmärtämään, mitä tietorakenteita on saatavilla R-kielellä. Tarkastellaan yksityiskohtaisesti vektoreita, päivämääräkehyksiä ja listoja. Opitaan luomaan niitä ja käyttämään niiden yksittäisiä elementtejä.
Oppitunti 3: Tietojen lukeminen TSV-, CSV-, Excel-tiedostoista ja Google-taulukoista
Описание:
Tietojen käsittely työkalusta riippumatta alkaa sen poimimisesta. Paketteja käytetään tunnilla vroom, readxl, googlesheets4 tietojen lataamiseen R-ympäristöön csv-, tsv-, Excel-tiedostoista ja Google Sheetsistä.
Oppitunti 4: Rivien suodattaminen, sarakkeiden, liukuhihnan valitseminen ja uudelleennimeäminen R:ssä
Описание:
Tämä oppitunti käsittelee pakettia dplyr. Siinä selvitämme, kuinka tietokehykset suodatetaan, valitaan tarvittavat sarakkeet ja nimetään ne uudelleen.
Opimme myös, mitä liukuhihnat ovat ja kuinka ne auttavat tekemään R-koodistasi luettavamman.
Oppitunti 5: Laskettujen sarakkeiden lisääminen taulukkoon R
Описание:
Tällä videolla jatkamme tutustumista kirjastoon tidyverse ja paketti dplyr.
Katsotaanpa toimintoperhettä mutate(), ja opimme käyttämään niitä uusien laskettujen sarakkeiden lisäämiseen taulukkoon.
Oppitunti 6: Tietojen ryhmittely ja yhdistäminen R:ssä
Описание:
Tämä oppitunti on omistettu yhdelle tietojen analysoinnin, ryhmittelyn ja aggregoinnin päätoiminnoista. Oppitunnin aikana käytämme pakettia dplyr ja ominaisuuksia group_by() и summarise().
Tutustumme koko toimintoperheeseen summarise(), ts. summarise(), summarise_if() и summarise_at().
Oppitunti 7: Pöytien pysty- ja vaakasuora yhdistäminen R:ssä
Описание:
Ikkunafunktiot ovat merkitykseltään samanlaisia kuin aggregoivat; ne ottavat myös syötteenä joukon arvoja ja suorittavat niille aritmeettisia operaatioita, mutta eivät muuta rivien määrää tulostetussa tuloksessa.
Tässä opetusohjelmassa jatkamme paketin tutkimista dplyr, ja toiminnot group_by(), mutate(), sekä uusia cumsum(), lag(), lead() и arrange().
Oppitunti 9: Pyörivät taulukot tai pivot-taulukoiden analogi R:ssä
Описание:
Useimmat Excel-käyttäjät käyttävät pivot-taulukoita; tämä on kätevä työkalu, jolla voit muuntaa joukon raakadataa luettavissa oleviksi raporteiksi muutamassa sekunnissa.
Tässä opetusohjelmassa tarkastellaan taulukoiden kiertämistä R-kielellä ja niiden muuntamista leveästä pitkiin ja päinvastoin.
Suurin osa oppitunnista on omistettu paketille tidyr ja toiminnot pivot_longer() и pivot_wider().
Oppitunti 10: JSON-tiedostojen lataaminen R:ssä ja luetteloiden muuntaminen taulukoiksi
Описание:
JSON ja XML ovat äärimmäisen suosittuja formaatteja tietojen tallentamiseen ja vaihtamiseen, yleensä niiden kompaktin koon vuoksi.
Mutta tällaisissa muodoissa esitettyjä tietoja on vaikea analysoida, joten ennen analysointia on tarpeen tuoda se taulukkomuotoon, minkä opimme juuri tässä videossa.
Oppitunti on omistettu paketille tidyr, sisältyy kirjaston ytimeen tidyverse, ja toiminnot unnest_longer(), unnest_wider() и hoist().
Oppitunti 11: Piirtäminen nopeasti qplot()-funktion avulla
Описание:
Oppitunti osoittaa paketin täyden tehon ggplot2 ja kielioppi graafien rakentamiseen siihen upotettuihin tasoihin.
Analysoimme pakkauksessa olevat tärkeimmät geometriat ja opimme käyttämään tasoja kaavion rakentamiseen.
Johtopäätös
Yritin lähestyä kurssiohjelman muodostamista mahdollisimman ytimekkäästi, korostaakseen vain tarpeellisimmat tiedot, joita tarvitset ottaaksesi ensimmäiset askeleet sellaisen tehokkaan data-analyysityökalun kuin R-kielen oppimisessa.
Kurssi ei ole tyhjentävä opas tietojen analysointiin R-kielellä, mutta se auttaa sinua ymmärtämään kaikki tähän tarvittavat tekniikat.
Vaikka kurssiohjelma on suunniteltu 12 viikoksi, avaan joka viikko maanantaisin pääsyn uusille tunneille, joten suosittelen Merkitä YouTube-kanavalla, jotta et menetä uuden oppitunnin julkaisua.