Langage R pour les utilisateurs d'Excel (cours vidéo gratuit)

En raison de la quarantaine, beaucoup passent désormais la majeure partie de leur temps à la maison, et ce temps peut, et même devrait, être utilisé utilement.

Au début du confinement, j'ai décidé de terminer certains projets que j'avais commencés il y a quelques mois. L'un de ces projets était le cours vidéo « R Language for Excel Users ». Avec ce cours, j'ai voulu abaisser la barrière à l'entrée dans R, et combler légèrement le manque existant de matériel de formation sur ce sujet en russe.

Si tout le travail avec les données dans l'entreprise pour laquelle vous travaillez est toujours effectué dans Excel, je vous suggère de vous familiariser avec un outil d'analyse de données plus moderne et en même temps totalement gratuit.

Langage R pour les utilisateurs d'Excel (cours vidéo gratuit)

Teneur

Si vous êtes intéressé par l'analyse des données, vous pourriez être intéressé par mon télégramme и Youtube canaux. La plupart du contenu est dédié au langage R.

  1. références
  2. A propos du cours
  3. A qui est destiné ce cours?
  4. Programme de cours
    4.1. Leçon 1 : Installer le langage R et l'environnement de développement RStudio
    4.2. Leçon 2 : Structures de données de base dans R
    4.3. Leçon 3 : Lecture de données à partir de fichiers TSV, CSV, Excel et Google Sheets
    4.4. Leçon 4 : Filtrage des lignes, sélection et renommage des colonnes, pipelines dans R
    4.5. Leçon 5 : Ajout de colonnes calculées à une table dans R
    4.6. Leçon 6 : Regroupement et agrégation de données dans R
    4.7. Leçon 7 : Jointure verticale et horizontale de tables dans R
    4.8. Leçon 8 : Fonctions de fenêtre dans R
    4.9. Leçon 9 : Tables tournantes ou un analogue des tableaux croisés dynamiques dans R
    4.10. Leçon 10 : Chargement de fichiers JSON dans R et conversion de listes en tables
    4.11. Leçon 11 : Tracer rapidement à l'aide de la fonction qplot()
    4.12. Leçon 12 : Tracer des tracés couche par couche à l'aide du package ggplot2
  5. Conclusion

références

A propos du cours

Le cours est structuré autour de l'architecture tidyverse, et les packages qu'il contient : readr, vroom, dplyr, tidyr, ggplot2. Bien sûr, il existe d'autres bons packages dans R qui effectuent des opérations similaires, par exemple data.table, mais la syntaxe tidyverse intuitif, facile à lire même pour un utilisateur non formé, je pense donc qu'il vaut mieux commencer à apprendre le langage R avec tidyverse.

Le cours vous guidera à travers toutes les opérations d'analyse des données, du chargement à la visualisation du résultat final.

Pourquoi R et pas Python ? Parce que R est un langage fonctionnel, il est plus facile pour les utilisateurs d'Excel d'y passer, car pas besoin de se plonger dans la programmation orientée objet traditionnelle.

Actuellement, 12 cours vidéo sont prévus, d'une durée de 5 à 20 minutes chacun.

Les cours ouvriront progressivement. Chaque lundi, j'ouvrirai l'accès à une nouvelle leçon sur mon site internet. Chaîne Youtube dans une liste de lecture séparée.

A qui est destiné ce cours?

Je pense que cela ressort clairement du titre, mais je vais le décrire plus en détail.

Le cours s'adresse à ceux qui utilisent activement Microsoft Excel dans leur travail et y mettent en œuvre tout leur travail avec des données. En général, si vous ouvrez l'application Microsoft Excel au moins une fois par semaine, alors le cours vous convient.

Vous n'êtes pas obligé d'avoir des compétences en programmation pour suivre le cours, car... Le cours s'adresse aux débutants.

Mais peut-être qu’à partir de la leçon 4, il y aura aussi du matériel intéressant pour les utilisateurs actifs de R, car... la fonctionnalité principale de packages tels que dplyr и tidyr sera discutée de manière assez détaillée.

Programme de cours

Leçon 1 : Installer le langage R et l'environnement de développement RStudio

Date de publication: Mars 23 2020

Liens:

Vidéo:

Description:
Une leçon d'introduction au cours de laquelle nous téléchargerons et installerons le logiciel nécessaire, et examinerons brièvement les capacités et l'interface de l'environnement de développement RStudio.

Leçon 2 : Structures de données de base dans R

Date de publication: Mars 30 2020

Liens:

Vidéo:

Description:
Cette leçon vous aidera à comprendre quelles structures de données sont disponibles dans le langage R. Nous examinerons en détail les vecteurs, les images de date et les listes. Apprenons à les créer et à accéder à leurs éléments individuels.

Leçon 3 : Lecture de données à partir de fichiers TSV, CSV, Excel et Google Sheets

Date de publication: Avril 6 2020

Liens:

Vidéo:

Description:
Travailler avec des données, quel que soit l'outil, commence par leur extraction. Les forfaits sont utilisés pendant le cours vroom, readxl, googlesheets4 pour charger des données dans l'environnement R à partir de fichiers csv, tsv, Excel et Google Sheets.

Leçon 4 : Filtrage des lignes, sélection et renommage des colonnes, pipelines dans R

Date de publication: Avril 13 2020

Liens:

Vidéo:

Description:
Cette leçon concerne le package dplyr. Nous y découvrirons comment filtrer les dataframes, sélectionner les colonnes nécessaires et les renommer.

Nous apprendrons également ce que sont les pipelines et comment ils contribuent à rendre votre code R plus lisible.

Leçon 5 : Ajout de colonnes calculées à une table dans R

Date de publication: Avril 20 2020

Liens:

Vidéo:

Description:
Dans cette vidéo, nous continuons notre connaissance de la bibliothèque tidyverse et paquet dplyr.
Regardons la famille de fonctions mutate(), et nous apprendrons comment les utiliser pour ajouter de nouvelles colonnes calculées au tableau.

Leçon 6 : Regroupement et agrégation de données dans R

Date de publication: Avril 27 2020

Liens:

Vidéo:

Description:
Cette leçon est consacrée à l'une des principales opérations d'analyse, de regroupement et d'agrégation des données. Pendant le cours, nous utiliserons le package dplyr et fonctionnalités group_by() и summarise().

Nous examinerons toute la famille de fonctions summarise()C.-à- summarise(), summarise_if() и summarise_at().

Leçon 7 : Jointure verticale et horizontale de tables dans R

Date de publication: 4 mai 2020

Liens:

Vidéo:

Description:
Cette leçon vous aidera à comprendre les opérations de jonction verticale et horizontale des tables.

Une union verticale est l'équivalent de l'opération UNION dans le langage de requête SQL.

La jointure horizontale est mieux connue des utilisateurs d'Excel grâce à la fonction RECHERCHEV ; en SQL, ces opérations sont effectuées par l'opérateur JOIN.

Pendant la leçon, nous résoudrons un problème pratique au cours duquel nous utiliserons des packages dplyr, readxl, tidyr и stringr.

Les principales fonctions que nous considérerons :

  • bind_rows() - jointure verticale de tables
  • left_join() — jointure horizontale de tables
  • semi_join() - y compris les tables de jointure
  • anti_join() - jointure de table exclusive

Leçon 8 : Fonctions de fenêtre dans R

Date de publication: 11 mai 2020

Liens:

Description:
Les fonctions de fenêtre ont une signification similaire à celles d'agrégation : elles prennent également un tableau de valeurs en entrée et effectuent des opérations arithmétiques sur celles-ci, mais ne modifient pas le nombre de lignes dans le résultat de sortie.

Dans ce tutoriel, nous continuons à étudier le package dplyr, et fonctions group_by(), mutate(), ainsi que du nouveau cumsum(), lag(), lead() и arrange().

Leçon 9 : Tables tournantes ou un analogue des tableaux croisés dynamiques dans R

Date de publication: 18 mai 2020

Liens:

Description:
La plupart des utilisateurs d'Excel utilisent des tableaux croisés dynamiques ; il s'agit d'un outil pratique avec lequel vous pouvez transformer un ensemble de données brutes en rapports lisibles en quelques secondes.

Dans ce didacticiel, nous verrons comment faire pivoter des tableaux dans R et les convertir du format large au format long et vice versa.

La majeure partie de la leçon est consacrée au package tidyr et fonctions pivot_longer() и pivot_wider().

Leçon 10 : Chargement de fichiers JSON dans R et conversion de listes en tables

Date de publication: 25 mai 2020

Liens:

Description:
JSON et XML sont des formats extrêmement populaires pour stocker et échanger des informations, généralement en raison de leur compacité.

Mais il est difficile d'analyser les données présentées dans de tels formats, donc avant l'analyse, il est nécessaire de les présenter sous forme de tableau, ce que nous apprendrons exactement dans cette vidéo.

La leçon est dédiée au forfait tidyr, inclus dans le noyau de la bibliothèque tidyverse, et fonctions unnest_longer(), unnest_wider() и hoist().

Leçon 11 : Tracer rapidement à l'aide de la fonction qplot()

Date de publication: 1 2020 Juin

Liens:

Description:
Forfait ggplot2 est l'un des outils de visualisation de données les plus populaires, non seulement dans R.

Dans cette leçon, nous allons apprendre à créer des graphiques simples à l'aide de la fonction qplot(), et analysons tous ses arguments.

Leçon 12 : Tracer des tracés couche par couche à l'aide du package ggplot2

Date de publication: 8 2020 Juin

Liens:

Description:
La leçon démontre toute la puissance du package ggplot2 et la grammaire de la construction de graphiques en couches intégrées.

Nous analyserons les principales géométries présentes dans le package et apprendrons comment appliquer des couches pour créer un graphique.

Conclusion

J'ai essayé d'aborder la formation du programme de cours de la manière la plus concise possible, de mettre en évidence uniquement les informations les plus nécessaires dont vous aurez besoin pour faire les premiers pas dans l'apprentissage d'un outil d'analyse de données aussi puissant que le langage R.

Le cours n'est pas un guide exhaustif de l'analyse de données à l'aide du langage R, mais il vous aidera à comprendre toutes les techniques nécessaires pour cela.

Bien que le programme de cours soit conçu pour 12 semaines, chaque semaine le lundi j'ouvrirai l'accès à de nouveaux cours, je recommande donc Souscrire sur la chaîne YouTube pour ne pas rater la publication d'un nouveau cours.

Source: habr.com

Ajouter un commentaire