R-taal voor Excel-gebruikers (gratis videocursus)

Als gevolg van de quarantaine brengen velen nu het leeuwendeel van hun tijd thuis door, en deze tijd kan en moet zelfs nuttig worden besteed.

Aan het begin van de quarantaine besloot ik enkele projecten af ​​te ronden die ik een paar maanden geleden was begonnen. Eén van deze projecten was de videocursus “R Language for Excel Users”. Met deze cursus wilde ik de drempel voor toegang tot R verlagen en het bestaande tekort aan trainingsmateriaal over dit onderwerp in het Russisch enigszins opvullen.

Als al het werk met data in het bedrijf waarvoor je werkt nog steeds in Excel gebeurt, dan raad ik je aan om kennis te maken met een modernere en tegelijkertijd volledig gratis tool voor data-analyse.

R-taal voor Excel-gebruikers (gratis videocursus)

Inhoud

Als u geïnteresseerd bent in data-analyse, bent u wellicht geïnteresseerd in mijn telegram и youtube kanalen. Het grootste deel van de inhoud is gewijd aan de R-taal.

  1. referenties
  2. Over de cursus
  3. Voor wie is deze cursus bedoeld?
  4. Cursus programma
    4.1. Les 1: De R-taal en de RStudio-ontwikkelomgeving installeren
    4.2. Les 2: Basisgegevensstructuren in R
    4.3. Les 3: Gegevens lezen uit TSV-, CSV-, Excel-bestanden en Google Spreadsheets
    4.4. Les 4: Rijen filteren, kolommen selecteren en hernoemen, pijplijnen in R
    4.5. Les 5: Berekende kolommen toevoegen aan een tabel in R
    4.6. Les 6: Gegevens groeperen en aggregeren in R
    4.7. Les 7: Verticaal en horizontaal samenvoegen van tabellen in R
    4.8. Les 8: Vensterfuncties in R
    4.9. Les 9: Tabellen roteren of een analoog van draaitabellen in R
    4.10. Les 10: JSON-bestanden in R laden en lijsten naar tabellen converteren
    4.11. Les 11: Snel plotten met de functie qplot().
    4.12. Les 12: Laag voor laag plots plotten met behulp van het ggplot2-pakket
  5. Conclusie

referenties

Over de cursus

De cursus is opgebouwd rond architectuur tidyverse, en de pakketten die daarin zijn opgenomen: readr, vroom, dplyr, tidyr, ggplot2. Natuurlijk zijn er andere goede pakketten in R die bijvoorbeeld vergelijkbare bewerkingen uitvoeren data.table, maar de syntaxis tidyverse intuïtief, gemakkelijk te lezen, zelfs voor een ongetrainde gebruiker, dus ik denk dat het beter is om de R-taal mee te leren tidyverse.

De cursus begeleidt u bij alle gegevensanalysebewerkingen, van het laden tot het visualiseren van het eindresultaat.

Waarom R en niet Python? Omdat R een functionele taal is, kunnen Excel-gebruikers er gemakkelijker naar overschakelen het is niet nodig om je te verdiepen in traditioneel objectgeoriënteerd programmeren.

Momenteel staan ​​er 12 videolessen gepland van elk 5 tot 20 minuten.

De lessen zullen geleidelijk opengaan. Elke maandag open ik toegang tot een nieuwe les op mijn website. Youtube kanaal in een aparte afspeellijst.

Voor wie is deze cursus bedoeld?

Ik denk dat dit duidelijk blijkt uit de titel, maar ik zal het in meer detail beschrijven.

De cursus is bedoeld voor degenen die Microsoft Excel actief gebruiken in hun werk en daar al hun werk met gegevens implementeren. Als u minimaal één keer per week de Microsoft Excel-applicatie opent, is de cursus over het algemeen geschikt voor u.

Om de cursus te voltooien, hoeft u geen programmeervaardigheden te hebben, omdat... De cursus is gericht op beginners.

Maar misschien is er vanaf les 4 ook interessant materiaal voor actieve R-gebruikers, omdat... de belangrijkste functionaliteit van pakketten als dplyr и tidyr zal in enig detail worden besproken.

Cursus programma

Les 1: De R-taal en de RStudio-ontwikkelomgeving installeren

Publicatiedatum: Maart 23 2020

referenties:

Video:

Beschrijving:
Een introductieles waarin we de benodigde software downloaden en installeren, en kort de mogelijkheden en interface van de RStudio-ontwikkelomgeving onderzoeken.

Les 2: Basisgegevensstructuren in R

Publicatiedatum: Maart 30 2020

referenties:

Video:

Beschrijving:
Deze les zal u helpen begrijpen welke datastructuren beschikbaar zijn in de taal R. We zullen in detail kijken naar vectoren, datumframes en lijsten. Laten we leren hoe we ze kunnen maken en toegang krijgen tot hun individuele elementen.

Les 3: Gegevens lezen uit TSV-, CSV-, Excel-bestanden en Google Spreadsheets

Publicatiedatum: April 6 2020

referenties:

Video:

Beschrijving:
Het werken met gegevens, ongeacht de tool, begint met de extractie ervan. Tijdens de les wordt gebruik gemaakt van pakketten vroom, readxl, googlesheets4 voor het laden van gegevens in de R-omgeving vanuit csv-, tsv-, Excel-bestanden en Google Spreadsheets.

Les 4: Rijen filteren, kolommen selecteren en hernoemen, pijplijnen in R

Publicatiedatum: April 13 2020

referenties:

Video:

Beschrijving:
Deze les gaat over het pakket dplyr. Daarin zullen we uitzoeken hoe we dataframes kunnen filteren, de benodigde kolommen kunnen selecteren en de naam ervan kunnen wijzigen.

We zullen ook leren wat pijplijnen zijn en hoe ze helpen uw R-code leesbaarder te maken.

Les 5: Berekende kolommen toevoegen aan een tabel in R

Publicatiedatum: April 20 2020

referenties:

Video:

Beschrijving:
In deze video vervolgen we onze kennismaking met de bibliotheek tidyverse en pakket dplyr.
Laten we eens kijken naar de familie van functies mutate(), en we zullen leren hoe we ze kunnen gebruiken om nieuwe berekende kolommen aan de tabel toe te voegen.

Les 6: Gegevens groeperen en aggregeren in R

Publicatiedatum: April 27 2020

referenties:

Video:

Beschrijving:
Deze les is gewijd aan een van de belangrijkste handelingen van gegevensanalyse, groepering en aggregatie. Tijdens de les maken we gebruik van het pakket dplyr en functies group_by() и summarise().

We zullen naar de hele familie van functies kijken summarise(), Ie summarise(), summarise_if() и summarise_at().

Les 7: Verticaal en horizontaal samenvoegen van tabellen in R

Publicatiedatum: Mei 4 2020

referenties:

Video:

Beschrijving:
Deze les zal u helpen de bewerkingen van het verticaal en horizontaal samenvoegen van tabellen te begrijpen.

Een verticale unie is het equivalent van de UNION-bewerking in de SQL-querytaal.

Horizontale join is beter bekend bij Excel-gebruikers dankzij de VLOOKUP-functie; in SQL worden dergelijke bewerkingen uitgevoerd door de JOIN-operator.

Tijdens de les lossen we een praktisch probleem op, waarbij we gebruik maken van pakketten dplyr, readxl, tidyr и stringr.

De belangrijkste functies die we zullen overwegen:

  • bind_rows() - verticale verbinding van tabellen
  • left_join() — horizontale verbinding van tabellen
  • semi_join() - inclusief koppeltafels
  • anti_join() - exclusief tafellid worden

Les 8: Vensterfuncties in R

Publicatiedatum: Mei 11 2020

referenties:

Beschrijving:
Vensterfuncties hebben dezelfde betekenis als het aggregeren ervan; ze nemen ook een reeks waarden als invoer en voeren er rekenkundige bewerkingen op uit, maar veranderen het aantal rijen in het uitvoerresultaat niet.

In deze tutorial gaan we verder met het bestuderen van het pakket dplyren functies group_by(), mutate(), evenals nieuw cumsum(), lag(), lead() и arrange().

Les 9: Tabellen roteren of een analoog van draaitabellen in R

Publicatiedatum: Mei 18 2020

referenties:

Beschrijving:
De meeste Excel-gebruikers gebruiken draaitabellen; dit is een handig hulpmiddel waarmee u een reeks ruwe gegevens binnen enkele seconden kunt omzetten in leesbare rapporten.

In deze tutorial zullen we bekijken hoe je tabellen in R kunt roteren, en hoe je ze kunt converteren van breed naar lang formaat en omgekeerd.

Het grootste deel van de les is gewijd aan het pakket tidyr en functies pivot_longer() и pivot_wider().

Les 10: JSON-bestanden in R laden en lijsten naar tabellen converteren

Publicatiedatum: Mei 25 2020

referenties:

Beschrijving:
JSON en XML zijn extreem populaire formaten voor het opslaan en uitwisselen van informatie, meestal vanwege hun compactheid.

Maar het is moeilijk om gegevens die in dergelijke formaten worden gepresenteerd te analyseren, dus vóór de analyse is het noodzakelijk om deze in tabelvorm om te zetten, en dat is precies wat we in deze video zullen leren.

De les is gewijd aan het pakket tidyr, opgenomen in de kern van de bibliotheek tidyverseen functies unnest_longer(), unnest_wider() и hoist().

Les 11: Snel plotten met de functie qplot().

Publicatiedatum: Juni 1 2020

referenties:

Beschrijving:
Verpakking ggplot2 is een van de meest populaire tools voor datavisualisatie, niet alleen in R.

In deze les leren we hoe we eenvoudige grafieken kunnen maken met behulp van de functie qplot(), en laten we al haar argumenten analyseren.

Les 12: Laag voor laag plots plotten met behulp van het ggplot2-pakket

Publicatiedatum: Juni 8 2020

referenties:

Beschrijving:
De les demonstreert de volledige kracht van het pakket ggplot2 en de grammatica van het bouwen van grafieken in lagen die erin zijn ingebed.

We analyseren de belangrijkste geometrieën die in het pakket aanwezig zijn en leren hoe we lagen kunnen toepassen om een ​​grafiek te bouwen.

Conclusie

Ik heb geprobeerd de vorming van het cursusprogramma zo beknopt mogelijk te benaderen, om alleen de meest noodzakelijke informatie te benadrukken die je nodig hebt om de eerste stappen te zetten in het leren van zo'n krachtig hulpmiddel voor data-analyse als de R-taal.

De cursus is geen uitputtende gids voor data-analyse met behulp van de R-taal, maar zal u helpen alle noodzakelijke technieken hiervoor te begrijpen.

Hoewel het cursusprogramma is ontworpen voor 12 weken, geef ik elke week op maandag toegang tot nieuwe lessen, dus ik raad aan Abonneren op het YouTube-kanaal om de publicatie van een nieuwe les niet te missen.

Bron: www.habr.com

Voeg een reactie