A causa della quarantena, molte persone trascorrono la maggior parte del loro tempo a casa, e questo tempo può e anzi deve essere speso in modo utile.
All'inizio della quarantena, ho deciso di portare a termine alcuni progetti iniziati qualche mese fa. Uno di questi progetti era il videocorso "Linguaggio R per utenti Excel". Con questo corso, volevo abbassare la soglia di accesso a R e colmare la carenza di materiale didattico sull'argomento in russo.
Se nell'azienda per cui lavori tutto il lavoro con i dati viene ancora svolto in Excel, allora ti consiglio di familiarizzare con uno strumento di analisi dei dati più moderno e allo stesso tempo completamente gratuito.

contenuto
Se sei interessato all'analisi dei dati, potresti essere interessato al mio и canali. La maggior parte del contenuto è dedicata al linguaggio R.
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
riferimenti
Informazioni sul corso
Il corso è incentrato sull'architettura. tidyversee i pacchetti in esso inclusi: readr, vroom, dplyr, tidyr, ggplot2Naturalmente, ci sono altri buoni pacchetti in R che eseguono operazioni simili, ad esempio data.table, ma la sintassi tidyverse È intuitivo, facile da leggere anche per un utente non preparato, quindi penso che sia meglio iniziare ad imparare il linguaggio R con tidyverse.
Il corso ti guiderà attraverso tutte le operazioni di analisi dei dati, dal caricamento alla visualizzazione del risultato finale.
Perché R e non Python? Poiché R è un linguaggio funzionale, è più facile per gli utenti di Excel passare a esso, poiché non devono addentrarsi nella tradizionale programmazione orientata agli oggetti.
Al momento sono previste 12 videolezioni, ciascuna della durata da 5 a 20 minuti.
Le lezioni saranno aperte gradualmente. Ogni lunedì aprirò l'accesso a una nuova lezione sul mio in una playlist separata.
A chi è rivolto questo corso?
Penso che sia chiaro dal titolo, ma lo descriverò più dettagliatamente.
Il corso è rivolto a coloro che utilizzano attivamente Microsoft Excel nel proprio lavoro e che implementano tutte le operazioni con i dati. In generale, se apri l'applicazione Microsoft Excel almeno una volta alla settimana, il corso è adatto a te.
Per completare il corso non sono necessarie competenze di programmazione, poiché è rivolto ai principianti.
Ma, forse a partire dalla lezione 4, ci sarà materiale di interesse per gli utenti R attivi, poiché la funzionalità principale di pacchetti come dplyr и tidyr saranno considerati in modo sufficientemente dettagliato.
Programma del corso
Lezione 1: Installazione di R e RStudio
Data di pubblicazione: Marzo 23 2020
Links:
Video:

Descrizione:
Una lezione introduttiva durante la quale scaricheremo e installeremo il software necessario ed esamineremo brevemente le capacità e l'interfaccia dell'ambiente di sviluppo RStudio.
Lezione 2: Strutture dati di base in R
Data di pubblicazione: Marzo 30 2020
Links:
Video:

Descrizione:
Questa lezione ti aiuterà a comprendere cosa sono le strutture dati nel linguaggio R. Esamineremo in dettaglio vettori, data frame e liste. Impareremo come crearli e come accedere ai loro singoli elementi.
Lezione 3: Lettura dei dati da file TSV, CSV, Excel e Fogli Google
Data di pubblicazione: Aprile 6 2020
Links:
Video:

Descrizione:
Lavorare con i dati, indipendentemente dallo strumento utilizzato, inizia con la loro estrazione. Durante la lezione, vengono utilizzati pacchetti vroom, readxl, googlesheets4 per caricare dati nell'ambiente R da file csv, tsv, Excel e Google Sheets.
Lezione 4: Filtraggio delle righe, selezione e ridenominazione delle colonne, pipeline in R
Data di pubblicazione: Aprile 13 2020
Links:
Video:

Descrizione:
Questa lezione riguarda il pacchetto dplyrIn questo articolo scopriremo come filtrare i dataframe, selezionare le colonne necessarie e rinominarle.
Impareremo anche cosa sono le pipeline e come aiutano a rendere il codice R più leggibile.
Lezione 5: Aggiunta di colonne calcolate a una tabella in R
Data di pubblicazione: Aprile 20 2020
Links:
Video:

Descrizione:
In questo video continuiamo la nostra introduzione alla biblioteca tidyverse e un pacchetto dplyr.
Analizziamo la famiglia di funzioni mutate()e impareremo come utilizzarli per aggiungere nuove colonne calcolate alla tabella.
Lezione 6: Raggruppamento e aggregazione dei dati in R
Data di pubblicazione: Aprile 27 2020
Links:
Video:

Descrizione:
Questa lezione è dedicata a una delle operazioni fondamentali dell'analisi dei dati: il raggruppamento e l'aggregazione. Durante la lezione utilizzeremo il pacchetto dplyr e funzioni group_by() и summarise().
Prenderemo in considerazione l'intera famiglia di funzioni. summarise()Ie summarise(), summarise_if() и summarise_at().
Lezione 7: Unione verticale e orizzontale di tabelle in R
Data di pubblicazione: 4 maggio 2020
Links:
Video:

Descrizione:
Questo tutorial ti aiuterà a comprendere le operazioni di join verticale e orizzontale delle tabelle.
L'unione verticale è analoga all'operazione UNION nel linguaggio di query SQL.
L'unione orizzontale è più familiare agli utenti di Excel grazie alla funzione CERCA.VERT; in SQL tali operazioni vengono eseguite dall'operatore JOIN.
Durante la lezione risolveremo un problema pratico in cui utilizzeremo i pacchetti dplyr, readxl, tidyr и stringr.
Le principali funzioni che prenderemo in considerazione sono:
bind_rows()- giunzione verticale del tavololeft_join()- giunzione orizzontale del tavolosemi_join()- inclusa l'unione delle tabelleanti_join()- join esclusivo della tabella
Lezione 8: Funzioni finestra in R
Data di pubblicazione: 11 maggio 2020
Links:
Descrizione:
Le funzioni finestra hanno un significato simile alle funzioni di aggregazione; accettano anch'esse un array di valori come input ed eseguono operazioni aritmetiche su di essi, ma non modificano il numero di righe nel risultato di output.
In questo tutorial continuiamo ad esplorare il pacchetto dplyre funzioni group_by(), mutate(), così come quelli nuovi cumsum(), lag(), lead() и arrange().
Lezione 9: Tabelle pivot o l'equivalente delle tabelle pivot in R
Data di pubblicazione: 18 maggio 2020
Links:
Descrizione:
La maggior parte degli utenti di Excel utilizza le tabelle pivot, uno strumento utile che consente di trasformare in pochi secondi una grande quantità di dati grezzi in report leggibili.
In questo tutorial vedremo come ruotare le tabelle in R e convertirle dal formato largo a quello lungo e viceversa.
La maggior parte della lezione è dedicata al pacchetto tidyr e funzioni pivot_longer() и pivot_wider().
Lezione 10: Caricamento di file JSON in R e conversione di elenchi in tabelle
Data di pubblicazione: 25 maggio 2020
Links:
Descrizione:
JSON e XML sono formati estremamente diffusi per l'archiviazione e lo scambio di informazioni, solitamente grazie alla loro compattezza.
Tuttavia, è difficile analizzare i dati presentati in tali formati, quindi prima di analizzarli è necessario convertirli in una forma tabellare, ed è ciò che impareremo in questo video.
La lezione è dedicata al pacchetto tidyr, che fa parte del nucleo della biblioteca tidyversee funzioni unnest_longer(), unnest_wider() и hoist().
Lezione 11: Tracciare rapidamente grafici con qplot()
Data di pubblicazione: 1 2020 giugno
Links:
Descrizione:
Pacchetto ggplot2 è uno degli strumenti di visualizzazione dei dati più popolari non solo in R.
In questa lezione impareremo come tracciare grafici semplici utilizzando la funzione qplot()e analizzeremo tutti i suoi argomenti.
Lezione 12: Tracciamento strato per strato con il pacchetto ggplot2
Data di pubblicazione: 8 2020 giugno
Links:
Descrizione:
La lezione dimostra tutta la potenza del pacchetto. ggplot2 e la grammatica della costruzione di grafici in livelli incorporati in esso.
Analizzeremo le geometrie di base presenti nel pacchetto e impareremo come sovrapporre i livelli per costruire un grafico.
conclusione
Ho cercato di affrontare la struttura del programma del corso nel modo più conciso possibile, per evidenziare solo le informazioni più necessarie di cui avrete bisogno per muovere i primi passi nell'apprendimento di uno strumento di analisi dei dati così potente come il linguaggio R.
Questo corso non è una guida completa all'analisi dei dati con R, ma ti aiuterà a comprendere tutte le tecniche necessarie per farlo.
Per ora il programma del corso è progettato per 12 settimane, ogni settimana, il lunedì, aprirò l'accesso a nuove lezioni, quindi consiglio sul canale YouTube, per non perdere la pubblicazione di una nuova lezione.
Fonte: habr.com
