Lenguaje R para usuarios de Excel (curso en vídeo gratuito)
Debido a la cuarentena, muchos pasan ahora la mayor parte de su tiempo en casa, y este tiempo puede, e incluso debe, utilizarse de forma útil.
Al inicio de la cuarentena decidí terminar algunos proyectos que comencé hace unos meses. Uno de estos proyectos fue el curso en vídeo “Lenguaje R para usuarios de Excel”. Con este curso quería reducir la barrera de entrada a R y cubrir ligeramente la escasez existente de materiales de formación sobre este tema en ruso.
Si todo el trabajo con datos en la empresa para la que trabaja todavía se realiza en Excel, le sugiero que se familiarice con una herramienta de análisis de datos más moderna y, al mismo tiempo, completamente gratuita.
contenido
Si te interesa el análisis de datos, quizás te interese mi Telegram. и Youtube canales La mayor parte del contenido está dedicado al lenguaje R.
El curso está estructurado en torno a la arquitectura. tidyverse, y los paquetes incluidos en el mismo: readr, vroom, dplyr, tidyr, ggplot2. Por supuesto, existen otros buenos paquetes en R que realizan operaciones similares, por ejemplo data.table, pero la sintaxis tidyverse intuitivo, fácil de leer incluso para un usuario no capacitado, por lo que creo que es mejor comenzar a aprender el lenguaje R con tidyverse.
El curso lo guiará a través de todas las operaciones de análisis de datos, desde la carga hasta la visualización del resultado final.
¿Por qué R y no Python? Debido a que R es un lenguaje funcional, es más fácil para los usuarios de Excel cambiar a él, porque No es necesario profundizar en la programación tradicional orientada a objetos.
Por el momento, están previstas 12 lecciones en vídeo, con una duración de entre 5 y 20 minutos cada una.
Las lecciones se abrirán gradualmente. Cada lunes abriré el acceso a una nueva lección en mi sitio web. Canal de Youtube en una lista de reproducción separada.
¿Para quién es este curso?
Creo que esto queda claro por el título, sin embargo, lo describiré con más detalle.
El curso está dirigido a quienes utilizan activamente Microsoft Excel en su trabajo e implementan allí todo su trabajo con datos. En general, si abre la aplicación Microsoft Excel al menos una vez a la semana, entonces el curso es adecuado para usted.
No es necesario tener conocimientos de programación para completar el curso, porque... El curso está dirigido a principiantes.
Pero, tal vez, a partir de la lección 4, también haya material interesante para los usuarios activos de R, porque... la funcionalidad principal de paquetes como dplyr и tidyr se discutirá con cierto detalle.
programa del curso
Lección 1: Instalación del lenguaje R y el entorno de desarrollo RStudio
Descripción:
Una lección introductoria durante la cual descargaremos e instalaremos el software necesario y examinaremos brevemente las capacidades y la interfaz del entorno de desarrollo RStudio.
Descripción:
Esta lección le ayudará a comprender qué estructuras de datos están disponibles en el lenguaje R. Examinaremos en detalle vectores, marcos de fechas y listas. Aprendamos cómo crearlos y acceder a sus elementos individuales.
Lección 3: Lectura de datos de archivos TSV, CSV, Excel y Google Sheets
Descripción:
Trabajar con datos, independientemente de la herramienta, comienza con su extracción. Los paquetes se utilizan durante la lección. vroom, readxl, googlesheets4 para cargar datos en el entorno R desde archivos csv, tsv, Excel y Google Sheets.
Lección 4: Filtrar filas, seleccionar y cambiar el nombre de columnas, canalizaciones en R
Descripción:
Esta lección es sobre el paquete. dplyr. En él descubriremos cómo filtrar marcos de datos, seleccionar las columnas necesarias y cambiarles el nombre.
También aprenderemos qué son las canalizaciones y cómo ayudan a que su código R sea más legible.
Lección 5: Agregar columnas calculadas a una tabla en R
Descripción:
En este vídeo continuamos conociendo la biblioteca. tidyverse y paquete dplyr.
Veamos la familia de funciones. mutate()y aprenderemos cómo usarlos para agregar nuevas columnas calculadas a la tabla.
Descripción:
Esta lección está dedicada a una de las principales operaciones de análisis, agrupación y agregación de datos. Durante la lección usaremos el paquete. dplyr y funciones group_by() и summarise().
Examinaremos toda la familia de funciones. summarise()es decir, summarise(), summarise_if() и summarise_at().
Lección 7: Unión vertical y horizontal de tablas en R
Descripción:
Las funciones de ventana tienen un significado similar a las de agregación; también toman una matriz de valores como entrada y realizan operaciones aritméticas con ellos, pero no cambian el número de filas en el resultado de salida.
En este tutorial continuamos estudiando el paquete. dplyry funciones group_by(), mutate(), así como nuevos cumsum(), lag(), lead() и arrange().
Lección 9: Mesas giratorias o un análogo de las tablas dinámicas en R
Descripción:
La mayoría de los usuarios de Excel utilizan tablas dinámicas; esta es una herramienta conveniente con la que puede convertir una serie de datos sin procesar en informes legibles en cuestión de segundos.
En este tutorial veremos cómo rotar tablas en R y convertirlas de formato ancho a largo y viceversa.
La mayor parte de la lección está dedicada al paquete. tidyr y funciones pivot_longer() и pivot_wider().
Lección 10: Carga de archivos JSON en R y conversión de listas en tablas
Descripción:
JSON y XML son formatos extremadamente populares para almacenar e intercambiar información, generalmente debido a su tamaño compacto.
Pero es difícil analizar los datos presentados en tales formatos, por lo que antes del análisis es necesario presentarlos en forma tabular, que es exactamente lo que aprenderemos en este video.
La lección está dedicada al paquete. tidyr, incluido en el núcleo de la biblioteca tidyversey funciones unnest_longer(), unnest_wider() и hoist().
Lección 11: Trazar rápidamente usando la función qplot()
Descripción:
La lección demuestra todo el poder del paquete. ggplot2 y la gramática de la construcción de gráficos en capas incrustadas en él.
Analizaremos las principales geometrías que están presentes en el paquete y aprenderemos cómo aplicar capas para construir un gráfico.
Conclusión
Intenté abordar la formación del programa del curso de la manera más concisa posible, para resaltar solo la información más necesaria que necesitará para dar los primeros pasos en el aprendizaje de una herramienta de análisis de datos tan poderosa como el lenguaje R.
El curso no es una guía exhaustiva para el análisis de datos utilizando R, pero le ayudará a comprender todas las técnicas necesarias para hacerlo.
Si bien el programa del curso está diseñado para 12 semanas, cada semana los lunes abriré el acceso a nuevas lecciones, por lo que recomiendo Suscribir en el canal de Youtube para no perderte la publicación de una nueva lección.