På grund av karantän tillbringar många nu lejonparten av sin tid hemma, och den här tiden kan, och bör till och med, spenderas nyttigt.
I början av karantänen bestämde jag mig för att avsluta några projekt som jag startade för några månader sedan. Ett av dessa projekt var videokursen "R Language for Excel-användare". Med den här kursen ville jag sänka barriären för inträde i R och något fylla den befintliga bristen på utbildningsmaterial om detta ämne på ryska.
Om allt arbete med data i företaget du arbetar på fortfarande görs i Excel, så föreslår jag att du bekantar dig med ett modernare, och samtidigt helt gratis, dataanalysverktyg.
Innehåll
Om du är intresserad av dataanalys kan du vara intresserad av min telegram и Youtube kanaler. Det mesta av innehållet är tillägnat R-språket.
Kursen är uppbyggd kring arkitektur tidyverse, och paketen som ingår i den: readr, vroom, dplyr, tidyr, ggplot2. Naturligtvis finns det andra bra paket i R som utför liknande operationer, till exempel data.table, men syntaxen tidyverse intuitivt, lätt att läsa även för en otränad användare, så jag tror att det är bättre att börja lära sig R-språket med tidyverse.
Kursen guidar dig genom alla dataanalysoperationer, från laddning till visualisering av det färdiga resultatet.
Varför R och inte Python? Eftersom R är ett funktionellt språk är det lättare för Excel-användare att byta till det, eftersom du behöver inte fördjupa dig i traditionell objektorienterad programmering.
För tillfället är 12 videolektioner planerade, vardera från 5 till 20 minuter.
Lektionerna kommer att öppnas gradvis. Varje måndag öppnar jag tillgång till en ny lektion på min hemsida. Youtube-kanal i en separat spellista.
Vem är den här kursen för?
Jag tror att detta framgår av titeln, men jag kommer att beskriva det mer detaljerat.
Kursen vänder sig till dig som aktivt använder Microsoft Excel i sitt arbete och implementerar allt sitt arbete med data där. I allmänhet, om du öppnar Microsoft Excel-applikationen minst en gång i veckan, så är kursen lämplig för dig.
Du behöver inte ha programmeringskunskaper för att slutföra kursen, eftersom... Kursen vänder sig till nybörjare.
Men kanske, från och med lektion 4, kommer det att finnas intressant material för aktiva R-användare också, eftersom... huvudfunktionaliteten för sådana paket som dplyr и tidyr kommer att diskuteras i detalj.
Kursprogram
Lektion 1: Installera R-språket och utvecklingsmiljön RStudio
Beskrivning:
En introduktionslektion under vilken vi kommer att ladda ner och installera den nödvändiga programvaran, och kort undersöka funktionerna och gränssnittet i RStudios utvecklingsmiljö.
Beskrivning:
Den här lektionen hjälper dig att förstå vilka datastrukturer som finns tillgängliga på språket R. Vi kommer att titta i detalj på vektorer, datumramar och listor. Låt oss lära oss att skapa dem och komma åt deras individuella element.
Lektion 3: Läsa data från TSV, CSV, Excel-filer och Google Sheets
Beskrivning:
Arbetet med data, oavsett verktyg, börjar med dess extraktion. Paket används under lektionen vroom, readxl, googlesheets4 för att ladda data till R-miljön från csv, tsv, Excel-filer och Google Sheets.
Lektion 4: Filtrera rader, välja och byta namn på kolumner, pipelines i R
Beskrivning:
Den här lektionen handlar om paketet dplyr. I den kommer vi att ta reda på hur man filtrerar dataramar, väljer de nödvändiga kolumnerna och byter namn på dem.
Vi kommer också att lära oss vad pipelines är och hur de hjälper till att göra din R-kod mer läsbar.
Lektion 5: Lägga till beräknade kolumner i en tabell i R
Beskrivning:
I den här videon fortsätter vi vår bekantskap med biblioteket tidyverse och paket dplyr.
Låt oss titta på familjen av funktioner mutate(), och vi kommer att lära oss hur du använder dem för att lägga till nya beräknade kolumner i tabellen.
Beskrivning:
Den här lektionen ägnas åt en av huvudoperationerna för dataanalys, gruppering och aggregering. Under lektionen kommer vi att använda paketet dplyr och funktioner group_by() и summarise().
Vi kommer att titta på hela familjen av funktioner summarise(), d.v.s. summarise(), summarise_if() и summarise_at().
Lektion 7: Vertikal och horisontell sammanfogning av tabeller i R
Beskrivning:
Fönsterfunktioner liknar betydelsen av aggregeringsfunktioner; de tar också en rad värden som indata och utför aritmetiska operationer på dem, men ändrar inte antalet rader i resultatet.
I den här handledningen fortsätter vi att studera paketet dplyr, och funktioner group_by(), mutate(), såväl som nya cumsum(), lag(), lead() и arrange().
Lektion 9: Roterande tabeller eller en analog av pivottabeller i R
Beskrivning:
De flesta Excel-användare använder pivottabeller; detta är ett praktiskt verktyg med vilket du kan förvandla en mängd rådata till läsbara rapporter på några sekunder.
I den här handledningen kommer vi att titta på hur man roterar tabeller i R och konverterar dem från brett till långt format och vice versa.
Det mesta av lektionen är tillägnad paketet tidyr och funktioner pivot_longer() и pivot_wider().
Lektion 10: Ladda JSON-filer i R och konvertera listor till tabeller
Beskrivning:
JSON och XML är extremt populära format för att lagra och utbyta information, vanligtvis på grund av deras kompakthet.
Men det är svårt att analysera data som presenteras i sådana format, så innan analys är det nödvändigt att ta det i en tabellform, vilket är exakt vad vi kommer att lära oss i den här videon.
Lektionen är tillägnad paketet tidyr, ingår i kärnan av biblioteket tidyverse, och funktioner unnest_longer(), unnest_wider() и hoist().
Beskrivning:
Lektionen visar paketets fulla kraft ggplot2 och grammatiken för att bygga grafer i lager inbäddade i den.
Vi kommer att analysera de huvudsakliga geometrierna som finns i paketet och lära oss hur man applicerar lager för att bygga en graf.
Slutsats
Jag försökte närma mig bildandet av kursprogrammet så kortfattat som möjligt, för att bara lyfta fram den mest nödvändiga informationen som du behöver för att ta de första stegen i att lära dig ett så kraftfullt dataanalysverktyg som R-språket.
Kursen är inte en uttömmande guide till dataanalys med R-språket, men den hjälper dig att förstå alla nödvändiga tekniker för detta.
Medan kursprogrammet är utformat för 12 veckor, kommer jag varje vecka på måndagar att öppna tillgång till nya lektioner, så jag rekommenderar prenumerera på YouTube-kanalen för att inte missa publiceringen av en ny lektion.