R-språk för Excel-användare (gratis videokurs)

På grund av karantän tillbringar många nu lejonparten av sin tid hemma, och den här tiden kan, och bör till och med, spenderas nyttigt.

I början av karantänen bestämde jag mig för att avsluta några projekt som jag startade för några månader sedan. Ett av dessa projekt var videokursen "R Language for Excel-användare". Med den här kursen ville jag sänka barriären för inträde i R och något fylla den befintliga bristen på utbildningsmaterial om detta ämne på ryska.

Om allt arbete med data i företaget du arbetar på fortfarande görs i Excel, så föreslår jag att du bekantar dig med ett modernare, och samtidigt helt gratis, dataanalysverktyg.

R-språk för Excel-användare (gratis videokurs)

Innehåll

Om du är intresserad av dataanalys kan du vara intresserad av min telegram и Youtube kanaler. Det mesta av innehållet är tillägnat R-språket.

  1. referenser
  2. Om kursen
  3. Vem är den här kursen för?
  4. Kursprogram
    4.1. Lektion 1: Installera R-språket och utvecklingsmiljön RStudio
    4.2. Lektion 2: Grundläggande datastrukturer i R
    4.3. Lektion 3: Läsa data från TSV, CSV, Excel-filer och Google Sheets
    4.4. Lektion 4: Filtrera rader, välja och byta namn på kolumner, pipelines i R
    4.5. Lektion 5: Lägga till beräknade kolumner i en tabell i R
    4.6. Lektion 6: Gruppera och aggregera data i R
    4.7. Lektion 7: Vertikal och horisontell sammanfogning av tabeller i R
    4.8. Lektion 8: Fönsterfunktioner i R
    4.9. Lektion 9: Roterande tabeller eller en analog av pivottabeller i R
    4.10. Lektion 10: Ladda JSON-filer i R och konvertera listor till tabeller
    4.11. Lektion 11: Plotta snabbt med funktionen qplot()
    4.12. Lektion 12: Rita lager för lager plotter med paketet ggplot2
  5. Slutsats

referenser

Om kursen

Kursen är uppbyggd kring arkitektur tidyverse, och paketen som ingår i den: readr, vroom, dplyr, tidyr, ggplot2. Naturligtvis finns det andra bra paket i R som utför liknande operationer, till exempel data.table, men syntaxen tidyverse intuitivt, lätt att läsa även för en otränad användare, så jag tror att det är bättre att börja lära sig R-språket med tidyverse.

Kursen guidar dig genom alla dataanalysoperationer, från laddning till visualisering av det färdiga resultatet.

Varför R och inte Python? Eftersom R är ett funktionellt språk är det lättare för Excel-användare att byta till det, eftersom du behöver inte fördjupa dig i traditionell objektorienterad programmering.

För tillfället är 12 videolektioner planerade, vardera från 5 till 20 minuter.

Lektionerna kommer att öppnas gradvis. Varje måndag öppnar jag tillgång till en ny lektion på min hemsida. Youtube-kanal i en separat spellista.

Vem är den här kursen för?

Jag tror att detta framgår av titeln, men jag kommer att beskriva det mer detaljerat.

Kursen vänder sig till dig som aktivt använder Microsoft Excel i sitt arbete och implementerar allt sitt arbete med data där. I allmänhet, om du öppnar Microsoft Excel-applikationen minst en gång i veckan, så är kursen lämplig för dig.

Du behöver inte ha programmeringskunskaper för att slutföra kursen, eftersom... Kursen vänder sig till nybörjare.

Men kanske, från och med lektion 4, kommer det att finnas intressant material för aktiva R-användare också, eftersom... huvudfunktionaliteten för sådana paket som dplyr и tidyr kommer att diskuteras i detalj.

Kursprogram

Lektion 1: Installera R-språket och utvecklingsmiljön RStudio

Publiceringsdatum: Mars 23 2020

Länkar:

videor:

Beskrivning:
En introduktionslektion under vilken vi kommer att ladda ner och installera den nödvändiga programvaran, och kort undersöka funktionerna och gränssnittet i RStudios utvecklingsmiljö.

Lektion 2: Grundläggande datastrukturer i R

Publiceringsdatum: Mars 30 2020

Länkar:

videor:

Beskrivning:
Den här lektionen hjälper dig att förstå vilka datastrukturer som finns tillgängliga på språket R. Vi kommer att titta i detalj på vektorer, datumramar och listor. Låt oss lära oss att skapa dem och komma åt deras individuella element.

Lektion 3: Läsa data från TSV, CSV, Excel-filer och Google Sheets

Publiceringsdatum: April 6 2020

Länkar:

videor:

Beskrivning:
Arbetet med data, oavsett verktyg, börjar med dess extraktion. Paket används under lektionen vroom, readxl, googlesheets4 för att ladda data till R-miljön från csv, tsv, Excel-filer och Google Sheets.

Lektion 4: Filtrera rader, välja och byta namn på kolumner, pipelines i R

Publiceringsdatum: April 13 2020

Länkar:

videor:

Beskrivning:
Den här lektionen handlar om paketet dplyr. I den kommer vi att ta reda på hur man filtrerar dataramar, väljer de nödvändiga kolumnerna och byter namn på dem.

Vi kommer också att lära oss vad pipelines är och hur de hjälper till att göra din R-kod mer läsbar.

Lektion 5: Lägga till beräknade kolumner i en tabell i R

Publiceringsdatum: April 20 2020

Länkar:

videor:

Beskrivning:
I den här videon fortsätter vi vår bekantskap med biblioteket tidyverse och paket dplyr.
Låt oss titta på familjen av funktioner mutate(), och vi kommer att lära oss hur du använder dem för att lägga till nya beräknade kolumner i tabellen.

Lektion 6: Gruppera och aggregera data i R

Publiceringsdatum: April 27 2020

Länkar:

videor:

Beskrivning:
Den här lektionen ägnas åt en av huvudoperationerna för dataanalys, gruppering och aggregering. Under lektionen kommer vi att använda paketet dplyr och funktioner group_by() и summarise().

Vi kommer att titta på hela familjen av funktioner summarise(), d.v.s. summarise(), summarise_if() и summarise_at().

Lektion 7: Vertikal och horisontell sammanfogning av tabeller i R

Publiceringsdatum: Maj 4 2020

Länkar:

videor:

Beskrivning:
Den här lektionen hjälper dig att förstå hur tabeller sammanfogas vertikalt och horisontellt.

En vertikal union är motsvarigheten till UNION-operationen i frågespråket SQL.

Horisontell koppling är mer känd för Excel-användare tack vare VLOOKUP-funktionen; i SQL utförs sådana operationer av JOIN-operatören.

Under lektionen kommer vi att lösa ett praktiskt problem under vilket vi kommer att använda paket dplyr, readxl, tidyr и stringr.

De viktigaste funktionerna som vi kommer att överväga:

  • bind_rows() - vertikal sammanfogning av bord
  • left_join() — horisontell sammanfogning av tabeller
  • semi_join() - inklusive sammanfogningsbord
  • anti_join() - exklusiva bordsanslutningar

Lektion 8: Fönsterfunktioner i R

Publiceringsdatum: Maj 11 2020

Länkar:

Beskrivning:
Fönsterfunktioner liknar betydelsen av aggregeringsfunktioner; de tar också en rad värden som indata och utför aritmetiska operationer på dem, men ändrar inte antalet rader i resultatet.

I den här handledningen fortsätter vi att studera paketet dplyr, och funktioner group_by(), mutate(), såväl som nya cumsum(), lag(), lead() и arrange().

Lektion 9: Roterande tabeller eller en analog av pivottabeller i R

Publiceringsdatum: Maj 18 2020

Länkar:

Beskrivning:
De flesta Excel-användare använder pivottabeller; detta är ett praktiskt verktyg med vilket du kan förvandla en mängd rådata till läsbara rapporter på några sekunder.

I den här handledningen kommer vi att titta på hur man roterar tabeller i R och konverterar dem från brett till långt format och vice versa.

Det mesta av lektionen är tillägnad paketet tidyr och funktioner pivot_longer() и pivot_wider().

Lektion 10: Ladda JSON-filer i R och konvertera listor till tabeller

Publiceringsdatum: Maj 25 2020

Länkar:

Beskrivning:
JSON och XML är extremt populära format för att lagra och utbyta information, vanligtvis på grund av deras kompakthet.

Men det är svårt att analysera data som presenteras i sådana format, så innan analys är det nödvändigt att ta det i en tabellform, vilket är exakt vad vi kommer att lära oss i den här videon.

Lektionen är tillägnad paketet tidyr, ingår i kärnan av biblioteket tidyverse, och funktioner unnest_longer(), unnest_wider() и hoist().

Lektion 11: Plotta snabbt med funktionen qplot()

Publiceringsdatum: Juni 1 2020

Länkar:

Beskrivning:
paket ggplot2 är ett av de mest populära datavisualiseringsverktygen, inte bara i R.

I den här lektionen kommer vi att lära oss hur man bygger enkla grafer med hjälp av funktionen qplot(), och låt oss analysera alla hennes argument.

Lektion 12: Rita lager för lager plotter med paketet ggplot2

Publiceringsdatum: Juni 8 2020

Länkar:

Beskrivning:
Lektionen visar paketets fulla kraft ggplot2 och grammatiken för att bygga grafer i lager inbäddade i den.

Vi kommer att analysera de huvudsakliga geometrierna som finns i paketet och lära oss hur man applicerar lager för att bygga en graf.

Slutsats

Jag försökte närma mig bildandet av kursprogrammet så kortfattat som möjligt, för att bara lyfta fram den mest nödvändiga informationen som du behöver för att ta de första stegen i att lära dig ett så kraftfullt dataanalysverktyg som R-språket.

Kursen är inte en uttömmande guide till dataanalys med R-språket, men den hjälper dig att förstå alla nödvändiga tekniker för detta.

Medan kursprogrammet är utformat för 12 veckor, kommer jag varje vecka på måndagar att öppna tillgång till nya lektioner, så jag rekommenderar prenumerera på YouTube-kanalen för att inte missa publiceringen av en ny lektion.

Källa: will.com

Lägg en kommentar