R-taal vir Excel-gebruikers (gratis videokursus)

As gevolg van kwarantyn spandeer baie nou die leeueaandeel van hul tyd by die huis, en hierdie tyd kan, en moet selfs, nuttig bestee word.

Aan die begin van kwarantyn het ek besluit om 'n paar projekte te voltooi wat ek 'n paar maande gelede begin het. Een van hierdie projekte was die videokursus “R Taal vir Excel-gebruikers”. Met hierdie kursus wou ek die versperring vir toegang tot R verlaag en die bestaande tekort aan opleidingsmateriaal oor hierdie onderwerp in Russies effens vul.

As alle werk met data in die maatskappy waarvoor jy werk steeds in Excel gedoen word, dan stel ek voor dat jy kennis maak met 'n meer moderne, en terselfdertyd heeltemal gratis, data-analise-instrument.

R-taal vir Excel-gebruikers (gratis videokursus)

inhoud

As jy belangstel in data-analise, sal jy dalk belangstel in my telegram и YouTube kanale. Die meeste van die inhoud daarvan word aan die R-taal gewy.

  1. verwysings
  2. Oor die kursus
  3. Vir wie is hierdie kursus?
  4. Kursus program
    4.1. Les 1: Installering van die R-taal en die RStudio-ontwikkelingsomgewing
    4.2. Les 2: Basiese datastrukture in R
    4.3. Les 3: Lees data van TSV-, CSV-, Excel-lêers en Google Sheets
    4.4. Les 4: Filtreer rye, kies en hernoem kolomme, pyplyne in R
    4.5. Les 5: Voeg berekende kolomme by 'n tabel in R
    4.6. Les 6: Groepering en samevoeging van data in R
    4.7. Les 7: Vertikale en horisontale samevoeging van tabelle in R
    4.8. Les 8: Vensterfunksies in R
    4.9. Les 9: Roterende tafels of 'n analoog van spiltafels in R
    4.10. Les 10: Laai JSON-lêers in R en omskakeling van lyste na tabelle
    4.11. Les 11: Plot vinnig deur die qplot()-funksie te gebruik
    4.12. Les 12: Teken laag vir laag plotte deur die ggplot2 pakket te gebruik
  5. Gevolgtrekking

verwysings

Oor die kursus

Die kursus is gestruktureer rondom argitektuur tidyverse, en die pakkette wat daarin ingesluit is: readr, vroom, dplyr, tidyr, ggplot2. Natuurlik is daar ander goeie pakkette in R wat byvoorbeeld soortgelyke bewerkings uitvoer data.table, maar die sintaksis tidyverse intuïtief, maklik om te lees, selfs vir 'n onopgeleide gebruiker, so ek dink dit is beter om die R-taal te begin leer met tidyverse.

Die kursus sal jou deur alle data-analise-bewerkings lei, van laai tot die visualisering van die voltooide resultaat.

Hoekom R en nie Python nie? Omdat R 'n funksionele taal is, is dit makliker vir Excel-gebruikers om daarna oor te skakel, want nie nodig om in tradisionele objekgeoriënteerde programmering te delf nie.

Op die oomblik word 12 videolesse beplan, wat elk van 5 tot 20 minute duur.

Lesse sal geleidelik oopmaak. Elke Maandag sal ek toegang tot 'n nuwe les op my webwerf oopmaak. YouTube-kanaal in 'n aparte snitlys.

Vir wie is hierdie kursus?

Ek dink dit is duidelik uit die titel, maar ek sal dit in meer besonderhede beskryf.

Die kursus is gemik op diegene wat Microsoft Excel aktief in hul werk gebruik en al hul werk met data daar implementeer. Oor die algemeen, as jy die Microsoft Excel-toepassing ten minste een keer per week oopmaak, dan is die kursus geskik vir jou.

Jy hoef nie programmeervaardighede te hê om die kursus te voltooi nie, want... Die kursus is gemik op beginners.

Maar miskien, vanaf les 4, sal daar ook interessante materiaal vir aktiewe R-gebruikers wees, want ... die hooffunksionaliteit van sulke pakkette soos dplyr и tidyr in detail bespreek sal word.

Kursus program

Les 1: Installering van die R-taal en die RStudio-ontwikkelingsomgewing

Datum van publikasie: Maart 23 2020

verwysings:

Video:

Description:
'n Inleidende les waartydens ons die nodige sagteware sal aflaai en installeer, en kortliks die vermoëns en koppelvlak van die RStudio-ontwikkelingsomgewing sal ondersoek.

Les 2: Basiese datastrukture in R

Datum van publikasie: Maart 30 2020

verwysings:

Video:

Description:
Hierdie les sal jou help om te verstaan ​​watter datastrukture beskikbaar is in die taal R. Ons sal in detail kyk na vektore, datumrame en lyste. Kom ons leer hoe om hulle te skep en toegang tot hul individuele elemente te kry.

Les 3: Lees data van TSV-, CSV-, Excel-lêers en Google Sheets

Datum van publikasie: April 6 2020

verwysings:

Video:

Description:
Werk met data, ongeag die instrument, begin met die onttrekking daarvan. Pakkette word tydens die les gebruik vroom, readxl, googlesheets4 vir die laai van data in die R-omgewing vanaf csv-, tsv-, Excel-lêers en Google Sheets.

Les 4: Filtreer rye, kies en hernoem kolomme, pyplyne in R

Datum van publikasie: April 13 2020

verwysings:

Video:

Description:
Hierdie les handel oor die pakket dplyr. Daarin sal ons uitvind hoe om datarame te filter, die nodige kolomme te kies en hulle te hernoem.

Ons sal ook leer wat pyplyne is en hoe dit help om jou R-kode meer leesbaar te maak.

Les 5: Voeg berekende kolomme by 'n tabel in R

Datum van publikasie: April 20 2020

verwysings:

Video:

Description:
In hierdie video gaan ons voort met ons kennismaking met die biblioteek tidyverse en pakket dplyr.
Kom ons kyk na die familie van funksies mutate(), en ons sal leer hoe om dit te gebruik om nuwe berekende kolomme by die tabel te voeg.

Les 6: Groepering en samevoeging van data in R

Datum van publikasie: April 27 2020

verwysings:

Video:

Description:
Hierdie les word gewy aan een van die hoofbewerkings van data-analise, groepering en samevoeging. Tydens die les sal ons die pakket gebruik dplyr en kenmerke group_by() и summarise().

Ons sal kyk na die hele familie van funksies summarise()Dws summarise(), summarise_if() и summarise_at().

Les 7: Vertikale en horisontale samevoeging van tabelle in R

Datum van publikasie: Mei 4 2020

verwysings:

Video:

Description:
Hierdie les sal jou help om die bewerkings van vertikale en horisontale koppeling van tabelle te verstaan.

'n Vertikale unie is die ekwivalent van die UNION-bewerking in die SQL-navraagtaal.

Horisontale aansluiting is beter bekend aan Excel-gebruikers danksy die VLOOKUP-funksie; in SQL word sulke bewerkings deur die JOIN-operateur uitgevoer.

Tydens die les sal ons 'n praktiese probleem oplos waartydens ons pakkette sal gebruik dplyr, readxl, tidyr и stringr.

Die belangrikste funksies wat ons sal oorweeg:

  • bind_rows() - Vertikale koppeling van tabelle
  • left_join() — horisontale samevoeging van tabelle
  • semi_join() - insluitend koppeling van tafels
  • anti_join() - eksklusiewe tafel aansluit

Les 8: Vensterfunksies in R

Datum van publikasie: Mei 11 2020

verwysings:

Description:
Vensterfunksies is soortgelyk in betekenis aan samevoegings; hulle neem ook 'n verskeidenheid waardes as invoer en voer rekenkundige bewerkings daarop uit, maar verander nie die aantal rye in die uitsetresultaat nie.

In hierdie tutoriaal gaan ons voort om die pakket te bestudeer dplyr, en funksies group_by(), mutate(), sowel as nuut cumsum(), lag(), lead() и arrange().

Les 9: Roterende tafels of 'n analoog van spiltafels in R

Datum van publikasie: Mei 18 2020

verwysings:

Description:
Die meeste Excel-gebruikers gebruik spilpunttabelle; dit is 'n gerieflike hulpmiddel waarmee u 'n verskeidenheid rou data binne 'n kwessie van sekondes in leesbare verslae kan omskep.

In hierdie tutoriaal sal ons kyk hoe om tabelle in R te draai, en dit van wye na lang formaat om te skakel en omgekeerd.

Die meeste van die les word aan die pakket gewy tidyr en funksies pivot_longer() и pivot_wider().

Les 10: Laai JSON-lêers in R en omskakeling van lyste na tabelle

Datum van publikasie: Mei 25 2020

verwysings:

Description:
JSON en XML is uiters gewilde formate vir die stoor en uitruil van inligting, gewoonlik as gevolg van hul kompaktheid.

Maar dit is moeilik om data wat in sulke formate aangebied word, te ontleed, dus voor ontleding is dit nodig om dit in 'n tabelvorm te bring, wat presies is wat ons in hierdie video sal leer.

Die les word aan die pakket gewy tidyr, ingesluit in die kern van die biblioteek tidyverse, en funksies unnest_longer(), unnest_wider() и hoist().

Les 11: Plot vinnig deur die qplot()-funksie te gebruik

Datum van publikasie: Junie 1 2020

verwysings:

Description:
pakket ggplot2 is een van die gewildste datavisualiseringsinstrumente, nie net in R.

In hierdie les sal ons leer hoe om eenvoudige grafieke te bou deur die funksie te gebruik qplot(), en kom ons ontleed al haar argumente.

Les 12: Teken laag vir laag plotte deur die ggplot2 pakket te gebruik

Datum van publikasie: Junie 8 2020

verwysings:

Description:
Die les demonstreer die volle krag van die pakket ggplot2 en die grammatika van die bou van grafieke in lae wat daarin ingebed is.

Ons sal die hoofgeometrieë wat in die pakket voorkom, ontleed en leer hoe om lae toe te pas om 'n grafiek te bou.

Gevolgtrekking

Ek het probeer om die vorming van die kursusprogram so bondig as moontlik te benader, om net die nodigste inligting uit te lig wat jy nodig het om die eerste stappe te neem om so 'n kragtige data-analise-instrument soos die R-taal te leer.

Die kursus is nie 'n volledige gids tot data-analise deur die R-taal te gebruik nie, maar dit sal jou help om al die nodige tegnieke hiervoor te verstaan.

Terwyl die kursusprogram vir 12 weke ontwerp is, sal ek elke week op Maandae toegang tot nuwe lesse oopmaak, so ek beveel aan skryf op die YouTube-kanaal om nie die publikasie van 'n nuwe les te mis nie.

Bron: will.com

Voeg 'n opmerking