R-taal foar Excel-brûkers (fergese fideokursus)

Fanwegen karantine besteegje in protte no it liuw syn diel fan har tiid thús troch, en dizze tiid kin, en moat sels, nuttich wurde bestege.

Oan it begjin fan quarantaine besleat ik guon projekten te foltôgjen dy't ik in pear moanne lyn begon. Ien fan dizze projekten wie de fideokursus "R Taal foar Excel-brûkers". Mei dizze kursus woe ik de barriêre foar yngong yn R ferleegje, en it besteande tekoart oan trainingsmateriaal oer dit ûnderwerp yn it Russysk in bytsje folje.

As alle wurk mei gegevens yn it bedriuw wêrfoar jo wurkje, noch altyd dien wurdt yn Excel, dan stel ik foar dat jo yn 'e kunde komme mei in moderner, en tagelyk folslein fergees, ark foar gegevensanalyse.

R-taal foar Excel-brûkers (fergese fideokursus)

Ynhâld

As jo ​​​​ynteressearre binne yn gegevensanalyse, kinne jo miskien wêze ynteressearre yn myn telegram и youtube kanalen. It grutste part fan de ynhâld is wijd oan de R-taal.

  1. referinsjes
  2. Oer de kursus
  3. Foar wa is dizze kursus?
  4. Kursus programma
    4.1. Les 1: Ynstallearje fan de R-taal en de RStudio-ûntwikkelomjouwing
    4.2. Les 2: Basisgegevensstruktueren yn R
    4.3. Les 3: Gegevens lêze fan TSV, CSV, Excel-bestannen en Google Blêden
    4.4. Les 4: Rigen filterje, kolommen selektearje en omneame, pipelines yn R
    4.5. Les 5: Berekkene kolommen tafoegje oan in tabel yn R
    4.6. Les 6: Gegevens groepearje en aggregearje yn R
    4.7. Les 7: Fertikale en horizontale gearfoegjen fan tabellen yn R
    4.8. Les 8: Finsterfunksjes yn R
    4.9. Les 9: Rotearjende tabellen as in analoog fan draaitabellen yn R
    4.10. Les 10: JSON-bestannen laden yn R en listen konvertearje nei tabellen
    4.11. les 11: Plotte fluch mei help fan de qplot () funksje
    4.12. Les 12: Plotten laach foar laach plots mei it pakket ggplot2
  5. konklúzje

referinsjes

Oer de kursus

De kursus is strukturearre om arsjitektuer tidyverse, en de pakketten dy't deryn binne: readr, vroom, dplyr, tidyr, ggplot2. Fansels binne d'r oare goede pakketten yn R dy't bygelyks ferlykbere operaasjes útfiere data.table, mar de syntaksis tidyverse yntuïtyf, maklik te lêzen, sels foar in net oplaat brûker, dus ik tink dat it better is om de R-taal te begjinnen mei tidyverse.

De kursus sil jo liede troch alle operaasjes foar gegevensanalyse, fan laden oant fisualisearjen fan it ôfmakke resultaat.

Wêrom R en net Python? Om't R in funksjonele taal is, is it makliker foar Excel-brûkers om der nei te wikseljen, om't gjin needsaak om te ferdjipjen yn tradisjonele objekt-rjochte programmearring.

Op it stuit binne 12 fideolessen pland, elk fan 5 oant 20 minuten.

Lessen sille stadichoan iepenje. Elke moandei sil ik tagong krije ta in nije les op myn webside. YouTube kanaal yn in aparte playlist.

Foar wa is dizze kursus?

Ik tink dat dit dúdlik is út 'e titel, lykwols sil ik it yn mear detail beskriuwe.

De kursus is rjochte op dyjingen dy't aktyf brûke Microsoft Excel yn harren wurk en útfiere al harren wurk mei gegevens dêr. Yn it algemien, as jo de Microsoft Excel-applikaasje op syn minst ien kear yn 'e wike iepenje, dan is de kursus geskikt foar jo.

Jo binne net ferplichte om programmearfeardigens te hawwen om de kursus te foltôgjen, om't ... De kursus is rjochte op begjinners.

Mar, miskien, fanôf les 4, sil d'r ek ynteressant materiaal wêze foar aktive R-brûkers, om't ... de wichtichste funksjonaliteit fan sokke pakketten as dplyr и tidyr sil wurde besprutsen yn wat detail.

Kursus programma

Les 1: Ynstallearje fan de R-taal en de RStudio-ûntwikkelomjouwing

Datum fan publikaasje: March 23 2020

Ferwizings:

Video:

Omskriuwing:
In ynliedende les wêryn't wy de nedige software sille downloade en ynstallearje, en koart de mooglikheden en ynterface fan 'e RStudio-ûntwikkelingsomjouwing ûndersykje.

Les 2: Basisgegevensstruktueren yn R

Datum fan publikaasje: March 30 2020

Ferwizings:

Video:

Omskriuwing:
Dizze les sil jo helpe om te begripen hokker gegevensstruktueren beskikber binne yn 'e taal R. Wy sille yn detail sjen nei vectoren, datumframes en listen. Litte wy leare hoe't jo se kinne meitsje en tagong krije ta har yndividuele eleminten.

Les 3: Gegevens lêze fan TSV, CSV, Excel-bestannen en Google Blêden

Datum fan publikaasje: April 6 2020

Ferwizings:

Video:

Omskriuwing:
Wurkje mei gegevens, nettsjinsteande it ark, begjint mei har ekstraksje. Pakketten wurde brûkt tidens de les vroom, readxl, googlesheets4 foar it laden fan gegevens yn 'e R-omjouwing fan csv, tsv, Excel-bestannen en Google Blêden.

Les 4: Rigen filterje, kolommen selektearje en omneame, pipelines yn R

Datum fan publikaasje: April 13 2020

Ferwizings:

Video:

Omskriuwing:
Dizze les giet oer it pakket dplyr. Dêryn sille wy útfine hoe't jo dataframes filterje, selektearje de nedige kolommen en omneame se.

Wy sille ek leare wat pipelines binne en hoe't se helpe om jo R-koade lêsberder te meitsjen.

Les 5: Berekkene kolommen tafoegje oan in tabel yn R

Datum fan publikaasje: April 20 2020

Ferwizings:

Video:

Omskriuwing:
Yn dizze fideo geane wy ​​troch mei ús kunde mei de biblioteek tidyverse en pakket dplyr.
Litte wy nei de famylje fan funksjes sjen mutate(), en wy sille leare hoe't jo se brûke om nije berekkene kolommen oan 'e tabel ta te foegjen.

Les 6: Gegevens groepearje en aggregearje yn R

Datum fan publikaasje: April 27 2020

Ferwizings:

Video:

Omskriuwing:
Dizze les is wijd oan ien fan 'e wichtichste operaasjes fan gegevensanalyse, groepearring en aggregaasje. Tidens de les sille wy it pakket brûke dplyr en funksjes group_by() и summarise().

Wy sille sjen nei de hiele famylje fan funksjes summarise(), d.h. summarise(), summarise_if() и summarise_at().

Les 7: Fertikale en horizontale gearfoegjen fan tabellen yn R

Datum fan publikaasje: 4 May 2020

Ferwizings:

Video:

Omskriuwing:
Dizze les sil jo helpe om de operaasjes te begripen fan fertikale en horizontale gearfoegjen fan tabellen.

In fertikale uny is it ekwivalint fan de UNION-operaasje yn 'e SQL-fraachtaal.

Horizontale join is better bekend foar Excel-brûkers troch de VLOOKUP-funksje; yn SQL wurde sokke operaasjes útfierd troch de JOIN-operator.

Tidens de les sille wy in praktysk probleem oplosse wêrby't wy pakketten brûke dplyr, readxl, tidyr и stringr.

De wichtichste funksjes dy't wy sille beskôgje:

  • bind_rows() - fertikale join fan tabellen
  • left_join() - horizontale gearhing fan tabellen
  • semi_join() - ynklusyf joining tabellen
  • anti_join() - eksklusive tafel join

Les 8: Finsterfunksjes yn R

Datum fan publikaasje: 11 May 2020

Ferwizings:

Omskriuwing:
Finsterfunksjes binne ferlykber yn betsjutting oan aggregearjen; se nimme ek in array fan wearden as ynfier en fiere rekenkundige operaasjes derop út, mar feroarje it oantal rigen yn it útfierresultaat net.

Yn dizze tutorial bliuwe wy it pakket bestudearje dplyr, en funksjes group_by(), mutate(), likegoed as nij cumsum(), lag(), lead() и arrange().

Les 9: Rotearjende tabellen as in analoog fan draaitabellen yn R

Datum fan publikaasje: 18 May 2020

Ferwizings:

Omskriuwing:
De measte Excel-brûkers brûke pivottabellen; dit is in handich ark wêrmei jo in array fan rauwe gegevens yn in kwestje fan sekonden kinne omsette yn lêsbere rapporten.

Yn dizze tutorial sille wy sjen hoe't jo tabellen yn R kinne rotearje, en se konvertearje fan breed nei lang formaat en oarsom.

It grutste part fan 'e les is wijd oan it pakket tidyr en funksjes pivot_longer() и pivot_wider().

Les 10: JSON-bestannen laden yn R en listen konvertearje nei tabellen

Datum fan publikaasje: 25 May 2020

Ferwizings:

Omskriuwing:
JSON en XML binne ekstreem populêre formaten foar it opslaan en útwikseljen fan ynformaasje, meastentiids fanwege har kompaktheid.

Mar it is lestich om gegevens te analysearjen dy't yn sokke formaten presintearre wurde, dus foardat de analyze is it nedich om it yn in tabelfoarm te bringen, dat is krekt wat wy sille leare yn dizze fideo.

De les is wijd oan it pakket tidyr, opnommen yn 'e kearn fan 'e bibleteek tidyverse, en funksjes unnest_longer(), unnest_wider() и hoist().

les 11: Plotte fluch mei help fan de qplot () funksje

Datum fan publikaasje: 1 2020 Juni

Ferwizings:

Omskriuwing:
Pakket ggplot2 is ien fan 'e populêrste ark foar gegevensfisualisaasje net allinich yn R.

Yn dizze les sille wy leare hoe't jo ienfâldige grafiken bouwe mei de funksje qplot(), en lit ús analysearje al har arguminten.

Les 12: Plotten laach foar laach plots mei it pakket ggplot2

Datum fan publikaasje: 8 2020 Juni

Ferwizings:

Omskriuwing:
De les toant de folsleine krêft fan it pakket ggplot2 en de grammatika fan it bouwen fan grafiken yn lagen dy't dêryn ynsletten binne.

Wy sille de wichtichste geometryen analysearje dy't oanwêzich binne yn it pakket en learje hoe't jo lagen kinne tapasse om in grafyk te bouwen.

konklúzje

Ik besocht de foarming fan it kursusprogramma sa koart mooglik te benaderjen, om allinich de meast nedige ynformaasje te markearjen dy't jo nedich binne om de earste stappen te nimmen yn it learen fan sa'n krêftich ark foar gegevensanalyse as de R-taal.

De kursus is gjin útputtende hantlieding foar gegevensanalyse mei de R-taal, mar it sil jo helpe om alle nedige techniken hjirfoar te begripen.

Wylst it kursusprogramma is ûntworpen foar 12 wiken, sil ik elke wike op moandei tagong iepenje foar nije lessen, dus ik advisearje ynskriuwe op it YouTube-kanaal om de publikaasje fan in nije les net te missen.

Boarne: www.habr.com

Add a comment