Langage R pour les utilisateurs d'Excel (cours vidéo gratuit)
En raison de la quarantaine, beaucoup passent désormais la majeure partie de leur temps à la maison, et ce temps peut, et même devrait, être utilisé utilement.
Au début du confinement, j'ai décidé de terminer certains projets que j'avais commencés il y a quelques mois. L'un de ces projets était le cours vidéo « R Language for Excel Users ». Avec ce cours, j'ai voulu abaisser la barrière à l'entrée dans R, et combler légèrement le manque existant de matériel de formation sur ce sujet en russe.
Si tout le travail avec les données dans l'entreprise pour laquelle vous travaillez est toujours effectué dans Excel, je vous suggère de vous familiariser avec un outil d'analyse de données plus moderne et en même temps totalement gratuit.
Teneur
Si vous êtes intéressé par l'analyse des données, vous pourriez être intéressé par mon télégramme и Youtube canaux. La plupart du contenu est dédié au langage R.
Le cours est structuré autour de l'architecture tidyverse, et les packages qu'il contient : readr, vroom, dplyr, tidyr, ggplot2. Bien sûr, il existe d'autres bons packages dans R qui effectuent des opérations similaires, par exemple data.table, mais la syntaxe tidyverse intuitif, facile à lire même pour un utilisateur non formé, je pense donc qu'il vaut mieux commencer à apprendre le langage R avec tidyverse.
Le cours vous guidera à travers toutes les opérations d'analyse des données, du chargement à la visualisation du résultat final.
Pourquoi R et pas Python ? Parce que R est un langage fonctionnel, il est plus facile pour les utilisateurs d'Excel d'y passer, car pas besoin de se plonger dans la programmation orientée objet traditionnelle.
Actuellement, 12 cours vidéo sont prévus, d'une durée de 5 à 20 minutes chacun.
Les cours ouvriront progressivement. Chaque lundi, j'ouvrirai l'accès à une nouvelle leçon sur mon site internet. Chaîne Youtube dans une liste de lecture séparée.
A qui est destiné ce cours?
Je pense que cela ressort clairement du titre, mais je vais le décrire plus en détail.
Le cours s'adresse à ceux qui utilisent activement Microsoft Excel dans leur travail et y mettent en œuvre tout leur travail avec des données. En général, si vous ouvrez l'application Microsoft Excel au moins une fois par semaine, alors le cours vous convient.
Vous n'êtes pas obligé d'avoir des compétences en programmation pour suivre le cours, car... Le cours s'adresse aux débutants.
Mais peut-être qu’à partir de la leçon 4, il y aura aussi du matériel intéressant pour les utilisateurs actifs de R, car... la fonctionnalité principale de packages tels que dplyr и tidyr sera discutée de manière assez détaillée.
Programme de cours
Leçon 1 : Installer le langage R et l'environnement de développement RStudio
Description:
Une leçon d'introduction au cours de laquelle nous téléchargerons et installerons le logiciel nécessaire, et examinerons brièvement les capacités et l'interface de l'environnement de développement RStudio.
Description:
Cette leçon vous aidera à comprendre quelles structures de données sont disponibles dans le langage R. Nous examinerons en détail les vecteurs, les images de date et les listes. Apprenons à les créer et à accéder à leurs éléments individuels.
Leçon 3 : Lecture de données à partir de fichiers TSV, CSV, Excel et Google Sheets
Description:
Travailler avec des données, quel que soit l'outil, commence par leur extraction. Les forfaits sont utilisés pendant le cours vroom, readxl, googlesheets4 pour charger des données dans l'environnement R à partir de fichiers csv, tsv, Excel et Google Sheets.
Leçon 4 : Filtrage des lignes, sélection et renommage des colonnes, pipelines dans R
Description:
Cette leçon concerne le package dplyr. Nous y découvrirons comment filtrer les dataframes, sélectionner les colonnes nécessaires et les renommer.
Nous apprendrons également ce que sont les pipelines et comment ils contribuent à rendre votre code R plus lisible.
Leçon 5 : Ajout de colonnes calculées à une table dans R
Description:
Dans cette vidéo, nous continuons notre connaissance de la bibliothèque tidyverse et paquet dplyr.
Regardons la famille de fonctions mutate(), et nous apprendrons comment les utiliser pour ajouter de nouvelles colonnes calculées au tableau.
Leçon 6 : Regroupement et agrégation de données dans R
Description:
Cette leçon est consacrée à l'une des principales opérations d'analyse, de regroupement et d'agrégation des données. Pendant le cours, nous utiliserons le package dplyr et fonctionnalités group_by() и summarise().
Nous examinerons toute la famille de fonctions summarise()C.-à- summarise(), summarise_if() и summarise_at().
Leçon 7 : Jointure verticale et horizontale de tables dans R
Description:
Cette leçon vous aidera à comprendre les opérations de jonction verticale et horizontale des tables.
Une union verticale est l'équivalent de l'opération UNION dans le langage de requête SQL.
La jointure horizontale est mieux connue des utilisateurs d'Excel grâce à la fonction RECHERCHEV ; en SQL, ces opérations sont effectuées par l'opérateur JOIN.
Pendant la leçon, nous résoudrons un problème pratique au cours duquel nous utiliserons des packages dplyr, readxl, tidyr и stringr.
Les principales fonctions que nous considérerons :
Description:
Les fonctions de fenêtre ont une signification similaire à celles d'agrégation : elles prennent également un tableau de valeurs en entrée et effectuent des opérations arithmétiques sur celles-ci, mais ne modifient pas le nombre de lignes dans le résultat de sortie.
Dans ce tutoriel, nous continuons à étudier le package dplyr, et fonctions group_by(), mutate(), ainsi que du nouveau cumsum(), lag(), lead() и arrange().
Leçon 9 : Tables tournantes ou un analogue des tableaux croisés dynamiques dans R
Description:
La plupart des utilisateurs d'Excel utilisent des tableaux croisés dynamiques ; il s'agit d'un outil pratique avec lequel vous pouvez transformer un ensemble de données brutes en rapports lisibles en quelques secondes.
Dans ce didacticiel, nous verrons comment faire pivoter des tableaux dans R et les convertir du format large au format long et vice versa.
La majeure partie de la leçon est consacrée au package tidyr et fonctions pivot_longer() и pivot_wider().
Leçon 10 : Chargement de fichiers JSON dans R et conversion de listes en tables
Description:
JSON et XML sont des formats extrêmement populaires pour stocker et échanger des informations, généralement en raison de leur compacité.
Mais il est difficile d'analyser les données présentées dans de tels formats, donc avant l'analyse, il est nécessaire de les présenter sous forme de tableau, ce que nous apprendrons exactement dans cette vidéo.
La leçon est dédiée au forfait tidyr, inclus dans le noyau de la bibliothèque tidyverse, et fonctions unnest_longer(), unnest_wider() и hoist().
Leçon 11 : Tracer rapidement à l'aide de la fonction qplot()
Description:
La leçon démontre toute la puissance du package ggplot2 et la grammaire de la construction de graphiques en couches intégrées.
Nous analyserons les principales géométries présentes dans le package et apprendrons comment appliquer des couches pour créer un graphique.
Conclusion
J'ai essayé d'aborder la formation du programme de cours de la manière la plus concise possible, de mettre en évidence uniquement les informations les plus nécessaires dont vous aurez besoin pour faire les premiers pas dans l'apprentissage d'un outil d'analyse de données aussi puissant que le langage R.
Le cours n'est pas un guide exhaustif de l'analyse de données à l'aide du langage R, mais il vous aidera à comprendre toutes les techniques nécessaires pour cela.
Bien que le programme de cours soit conçu pour 12 semaines, chaque semaine le lundi j'ouvrirai l'accès à de nouveaux cours, je recommande donc Souscrire sur la chaîne YouTube pour ne pas rater la publication d'un nouveau cours.