Linguaggio R per utenti Excel (videocorso gratuito)

A causa della quarantena, molti ora trascorrono la maggior parte del loro tempo a casa e questo tempo può, e addirittura deve, essere speso in modo utile.

All’inizio della quarantena ho deciso di portare a termine alcuni progetti iniziati qualche mese fa. Uno di questi progetti è stato il videocorso “R Language for Excel Users”. Con questo corso, volevo abbassare la barriera all'ingresso in R e colmare leggermente la carenza esistente di materiale didattico su questo argomento in russo.

Se tutto il lavoro con i dati nell'azienda per cui lavori viene ancora svolto in Excel, allora ti suggerisco di familiarizzare con uno strumento di analisi dei dati più moderno e allo stesso tempo completamente gratuito.

Linguaggio R per utenti Excel (videocorso gratuito)

contenuto

Se sei interessato all'analisi dei dati, potresti essere interessato al mio Telegram и youtube canali. La maggior parte del contenuto è dedicata al linguaggio R.

  1. riferimenti
  2. Sul corso
  3. A chi è rivolto questo corso?
  4. Programma del corso
    4.1 Lezione 1: Installazione del linguaggio R e dell'ambiente di sviluppo RStudio
    4.2 Lezione 2: Strutture dati di base in R
    4.3 Lezione 3: Lettura di dati da file TSV, CSV, Excel e Fogli Google
    4.4 Lezione 4: Filtrare righe, selezionare e rinominare colonne, pipeline in R
    4.5 Lezione 5: Aggiunta di colonne calcolate a una tabella in R
    4.6 Lezione 6: Raggruppamento e aggregazione dei dati in R
    4.7 Lezione 7: Unione verticale e orizzontale delle tabelle in R
    4.8 Lezione 8: Funzioni della finestra in R
    4.9 Lezione 9: Tabelle rotanti o un analogo delle tabelle pivot in R
    4.10 Lezione 10: Caricamento di file JSON in R e conversione di elenchi in tabelle
    4.11 Lezione 11: Tracciare velocemente utilizzando la funzione qplot()
    4.12 Lezione 12: Tracciatura di grafici strato per strato utilizzando il pacchetto ggplot2
  5. conclusione

riferimenti

Sul corso

Il corso è strutturato attorno all'architettura tidyversee i pacchetti in esso contenuti: readr, vroom, dplyr, tidyr, ggplot2. Naturalmente, ci sono altri buoni pacchetti in R che eseguono operazioni simili, ad esempio data.table, ma la sintassi tidyverse intuitivo, di facile lettura anche per un utente inesperto, quindi penso che sia meglio iniziare ad imparare il linguaggio R con tidyverse.

Il corso ti guiderà attraverso tutte le operazioni di analisi dei dati, dal caricamento alla visualizzazione del risultato finale.

Perché R e non Python? Poiché R è un linguaggio funzionale, è più semplice per gli utenti di Excel passare ad esso, perché non è necessario approfondire la tradizionale programmazione orientata agli oggetti.

Al momento sono previste 12 videolezioni, della durata dai 5 ai 20 minuti ciascuna.

Le lezioni apriranno gradualmente. Ogni lunedì aprirò l'accesso a una nuova lezione sul mio sito web. Canale Youtube in una playlist separata.

A chi è rivolto questo corso?

Penso che questo sia chiaro dal titolo, tuttavia lo descriverò in modo più dettagliato.

Il corso è rivolto a coloro che utilizzano attivamente Microsoft Excel nel proprio lavoro e implementano lì tutto il proprio lavoro con i dati. In generale, se apri l'applicazione Microsoft Excel almeno una volta alla settimana, il corso è adatto a te.

Non è necessario possedere competenze di programmazione per completare il corso, perché... Il corso è rivolto ai principianti.

Ma forse, a partire dalla lezione 4, ci sarà materiale interessante anche per gli utenti attivi di R, perché... la funzionalità principale di pacchetti come dplyr и tidyr sarà discusso in dettaglio.

Programma del corso

Lezione 1: Installazione del linguaggio R e dell'ambiente di sviluppo RStudio

Data di pubblicazione: Marzo 23 2020

Links:

Video:

Descrizione:
Una lezione introduttiva durante la quale scaricheremo e installeremo il software necessario ed esamineremo brevemente le funzionalità e l'interfaccia dell'ambiente di sviluppo RStudio.

Lezione 2: Strutture dati di base in R

Data di pubblicazione: Marzo 30 2020

Links:

Video:

Descrizione:
Questa lezione ti aiuterà a capire quali strutture dati sono disponibili nel linguaggio R. Esamineremo in dettaglio i vettori, i data frame e gli elenchi. Impariamo come crearli e accedere ai loro singoli elementi.

Lezione 3: Lettura di dati da file TSV, CSV, Excel e Fogli Google

Data di pubblicazione: Aprile 6 2020

Links:

Video:

Descrizione:
Il lavoro con i dati, indipendentemente dallo strumento, inizia con la loro estrazione. I pacchetti vengono utilizzati durante la lezione vroom, readxl, googlesheets4 per caricare dati nell'ambiente R da file CSV, TSV, Excel e Fogli Google.

Lezione 4: Filtrare righe, selezionare e rinominare colonne, pipeline in R

Data di pubblicazione: Aprile 13 2020

Links:

Video:

Descrizione:
Questa lezione riguarda il pacchetto dplyr. In esso scopriremo come filtrare i dataframe, selezionare le colonne necessarie e rinominarle.

Impareremo anche cosa sono le pipeline e come aiutano a rendere il codice R più leggibile.

Lezione 5: Aggiunta di colonne calcolate a una tabella in R

Data di pubblicazione: Aprile 20 2020

Links:

Video:

Descrizione:
In questo video continuiamo la nostra conoscenza della biblioteca tidyverse e pacchetto dplyr.
Consideriamo la famiglia delle funzioni mutate()e impareremo come utilizzarli per aggiungere nuove colonne calcolate alla tabella.

Lezione 6: Raggruppamento e aggregazione dei dati in R

Data di pubblicazione: Aprile 27 2020

Links:

Video:

Descrizione:
Questa lezione è dedicata ad una delle principali operazioni di analisi, raggruppamento e aggregazione dei dati. Durante la lezione utilizzeremo il pacchetto dplyr e caratteristiche group_by() и summarise().

Considereremo l'intera famiglia di funzioni summarise()Ie summarise(), summarise_if() и summarise_at().

Lezione 7: Unione verticale e orizzontale delle tabelle in R

Data di pubblicazione: 4 maggio 2020

Links:

Video:

Descrizione:
Questa lezione ti aiuterà a comprendere le operazioni di unione verticale e orizzontale delle tabelle.

Un'unione verticale è l'equivalente dell'operazione UNION nel linguaggio di query SQL.

Il join orizzontale è meglio conosciuto dagli utenti di Excel grazie alla funzione CERCA.VERT; in SQL tali operazioni vengono eseguite dall'operatore JOIN.

Durante la lezione risolveremo un problema pratico durante il quale utilizzeremo i pacchetti dplyr, readxl, tidyr и stringr.

Le principali funzioni che prenderemo in considerazione:

  • bind_rows() - unione verticale dei tavoli
  • left_join() — unione orizzontale dei tavoli
  • semi_join() - comprese le tabelle di unione
  • anti_join() - unione esclusiva dei tavoli

Lezione 8: Funzioni della finestra in R

Data di pubblicazione: 11 maggio 2020

Links:

Descrizione:
Le funzioni della finestra hanno un significato simile a quelle di aggregazione; prendono anche una serie di valori come input ed eseguono operazioni aritmetiche su di essi, ma non modificano il numero di righe nel risultato di output.

In questo tutorial continuiamo a studiare il pacchetto dplyre funzioni group_by(), mutate(), oltre che nuovo cumsum(), lag(), lead() и arrange().

Lezione 9: Tabelle rotanti o un analogo delle tabelle pivot in R

Data di pubblicazione: 18 maggio 2020

Links:

Descrizione:
La maggior parte degli utenti di Excel utilizza le tabelle pivot; questo è uno strumento utile con cui è possibile trasformare una serie di dati grezzi in report leggibili in pochi secondi.

In questo tutorial vedremo come ruotare le tabelle in R e convertirle dal formato largo a quello lungo e viceversa.

La maggior parte della lezione è dedicata al pacchetto tidyr e funzioni pivot_longer() и pivot_wider().

Lezione 10: Caricamento di file JSON in R e conversione di elenchi in tabelle

Data di pubblicazione: 25 maggio 2020

Links:

Descrizione:
JSON e XML sono formati estremamente popolari per l'archiviazione e lo scambio di informazioni, solitamente per la loro compattezza.

Ma è difficile analizzare i dati presentati in tali formati, quindi prima dell'analisi è necessario trasformarli in una forma tabellare, che è esattamente ciò che impareremo in questo video.

La lezione è dedicata al pacchetto tidyr, incluso nel nucleo della biblioteca tidyversee funzioni unnest_longer(), unnest_wider() и hoist().

Lezione 11: Tracciare velocemente utilizzando la funzione qplot()

Data di pubblicazione: 1 2020 giugno

Links:

Descrizione:
Pacchetto ggplot2 è uno degli strumenti di visualizzazione dei dati più popolari non solo in R.

In questa lezione impareremo come costruire semplici grafici utilizzando la funzione qplot(), e analizziamo tutte le sue argomentazioni.

Lezione 12: Tracciatura di grafici strato per strato utilizzando il pacchetto ggplot2

Data di pubblicazione: 8 2020 giugno

Links:

Descrizione:
La lezione dimostra tutta la potenza del pacchetto ggplot2 e la grammatica della costruzione di grafici in strati incorporati in esso.

Analizzeremo le principali geometrie presenti nel pacchetto e impareremo come applicare i layer per costruire un grafico.

conclusione

Ho cercato di affrontare la formazione del programma del corso nel modo più conciso possibile, per evidenziare solo le informazioni più necessarie di cui avrai bisogno per muovere i primi passi nell'apprendimento di uno strumento di analisi dei dati così potente come il linguaggio R.

Il corso non è una guida esaustiva all'analisi dei dati utilizzando il linguaggio R, ma ti aiuterà a comprendere tutte le tecniche necessarie a tal fine.

Anche se il programma del corso è pensato per 12 settimane, ogni settimana il lunedì aprirò l'accesso a nuove lezioni, quindi consiglio Abbonarsi sul canale YouTube per non perdere la pubblicazione di una nuova lezione.

Fonte: habr.com

Aggiungi un commento