Lenguaje R para usuarios de Excel (curso en vídeo gratuito)

Debido a la cuarentena, muchos pasan ahora la mayor parte de su tiempo en casa, y este tiempo puede, e incluso debe, utilizarse de forma útil.

Al inicio de la cuarentena decidí terminar algunos proyectos que comencé hace unos meses. Uno de estos proyectos fue el curso en vídeo “Lenguaje R para usuarios de Excel”. Con este curso quería reducir la barrera de entrada a R y cubrir ligeramente la escasez existente de materiales de formación sobre este tema en ruso.

Si todo el trabajo con datos en la empresa para la que trabaja todavía se realiza en Excel, le sugiero que se familiarice con una herramienta de análisis de datos más moderna y, al mismo tiempo, completamente gratuita.

Lenguaje R para usuarios de Excel (curso en vídeo gratuito)

contenido

Si te interesa el análisis de datos, quizás te interese mi Telegram. и Youtube canales La mayor parte del contenido está dedicado al lenguaje R.

  1. referencias
  2. Sobre el curso
  3. ¿Para quién es este curso?
  4. programa del curso
    4.1. Lección 1: Instalación del lenguaje R y el entorno de desarrollo RStudio
    4.2. Lección 2: Estructuras de datos básicas en R
    4.3. Lección 3: Lectura de datos de archivos TSV, CSV, Excel y Google Sheets
    4.4. Lección 4: Filtrar filas, seleccionar y cambiar el nombre de columnas, canalizaciones en R
    4.5. Lección 5: Agregar columnas calculadas a una tabla en R
    4.6. Lección 6: Agrupación y agregación de datos en R
    4.7. Lección 7: Unión vertical y horizontal de tablas en R
    4.8. Lección 8: Funciones de ventana en R
    4.9. Lección 9: Mesas giratorias o un análogo de las tablas dinámicas en R
    4.10. Lección 10: Carga de archivos JSON en R y conversión de listas en tablas
    4.11. Lección 11: Trazar rápidamente usando la función qplot()
    4.12. Lección 12: Trazar gráficos capa por capa usando el paquete ggplot2
  5. Conclusión

referencias

Sobre el curso

El curso está estructurado en torno a la arquitectura. tidyverse, y los paquetes incluidos en el mismo: readr, vroom, dplyr, tidyr, ggplot2. Por supuesto, existen otros buenos paquetes en R que realizan operaciones similares, por ejemplo data.table, pero la sintaxis tidyverse intuitivo, fácil de leer incluso para un usuario no capacitado, por lo que creo que es mejor comenzar a aprender el lenguaje R con tidyverse.

El curso lo guiará a través de todas las operaciones de análisis de datos, desde la carga hasta la visualización del resultado final.

¿Por qué R y no Python? Debido a que R es un lenguaje funcional, es más fácil para los usuarios de Excel cambiar a él, porque No es necesario profundizar en la programación tradicional orientada a objetos.

Por el momento, están previstas 12 lecciones en vídeo, con una duración de entre 5 y 20 minutos cada una.

Las lecciones se abrirán gradualmente. Cada lunes abriré el acceso a una nueva lección en mi sitio web. Canal de Youtube en una lista de reproducción separada.

¿Para quién es este curso?

Creo que esto queda claro por el título, sin embargo, lo describiré con más detalle.

El curso está dirigido a quienes utilizan activamente Microsoft Excel en su trabajo e implementan allí todo su trabajo con datos. En general, si abre la aplicación Microsoft Excel al menos una vez a la semana, entonces el curso es adecuado para usted.

No es necesario tener conocimientos de programación para completar el curso, porque... El curso está dirigido a principiantes.

Pero, tal vez, a partir de la lección 4, también haya material interesante para los usuarios activos de R, porque... la funcionalidad principal de paquetes como dplyr и tidyr se discutirá con cierto detalle.

programa del curso

Lección 1: Instalación del lenguaje R y el entorno de desarrollo RStudio

Fecha de publicación: Marzo 23 2020

Enlaces:

Vídeo:

Descripción:
Una lección introductoria durante la cual descargaremos e instalaremos el software necesario y examinaremos brevemente las capacidades y la interfaz del entorno de desarrollo RStudio.

Lección 2: Estructuras de datos básicas en R

Fecha de publicación: Marzo 30 2020

Enlaces:

Vídeo:

Descripción:
Esta lección le ayudará a comprender qué estructuras de datos están disponibles en el lenguaje R. Examinaremos en detalle vectores, marcos de fechas y listas. Aprendamos cómo crearlos y acceder a sus elementos individuales.

Lección 3: Lectura de datos de archivos TSV, CSV, Excel y Google Sheets

Fecha de publicación: Abril 6 2020

Enlaces:

Vídeo:

Descripción:
Trabajar con datos, independientemente de la herramienta, comienza con su extracción. Los paquetes se utilizan durante la lección. vroom, readxl, googlesheets4 para cargar datos en el entorno R desde archivos csv, tsv, Excel y Google Sheets.

Lección 4: Filtrar filas, seleccionar y cambiar el nombre de columnas, canalizaciones en R

Fecha de publicación: Abril 13 2020

Enlaces:

Vídeo:

Descripción:
Esta lección es sobre el paquete. dplyr. En él descubriremos cómo filtrar marcos de datos, seleccionar las columnas necesarias y cambiarles el nombre.

También aprenderemos qué son las canalizaciones y cómo ayudan a que su código R sea más legible.

Lección 5: Agregar columnas calculadas a una tabla en R

Fecha de publicación: Abril 20 2020

Enlaces:

Vídeo:

Descripción:
En este vídeo continuamos conociendo la biblioteca. tidyverse y paquete dplyr.
Veamos la familia de funciones. mutate()y aprenderemos cómo usarlos para agregar nuevas columnas calculadas a la tabla.

Lección 6: Agrupación y agregación de datos en R

Fecha de publicación: Abril 27 2020

Enlaces:

Vídeo:

Descripción:
Esta lección está dedicada a una de las principales operaciones de análisis, agrupación y agregación de datos. Durante la lección usaremos el paquete. dplyr y funciones group_by() и summarise().

Examinaremos toda la familia de funciones. summarise()es decir, summarise(), summarise_if() и summarise_at().

Lección 7: Unión vertical y horizontal de tablas en R

Fecha de publicación: 4 2020 mayo

Enlaces:

Vídeo:

Descripción:
Esta lección le ayudará a comprender las operaciones de unión vertical y horizontal de tablas.

Una unión vertical es el equivalente a la operación UNION en el lenguaje de consulta SQL.

La unión horizontal es más conocida por los usuarios de Excel gracias a la función BUSCARV; en SQL, estas operaciones las realiza el operador JOIN.

Durante la lección resolveremos un problema práctico durante el cual usaremos paquetes dplyr, readxl, tidyr и stringr.

Las principales funciones que consideraremos:

  • bind_rows() - unión vertical de mesas
  • left_join() — unión horizontal de mesas
  • semi_join() - incluyendo mesas de unión
  • anti_join() - unirse a la mesa exclusiva

Lección 8: Funciones de ventana en R

Fecha de publicación: 11 2020 mayo

Enlaces:

Descripción:
Las funciones de ventana tienen un significado similar a las de agregación; también toman una matriz de valores como entrada y realizan operaciones aritméticas con ellos, pero no cambian el número de filas en el resultado de salida.

En este tutorial continuamos estudiando el paquete. dplyry funciones group_by(), mutate(), así como nuevos cumsum(), lag(), lead() и arrange().

Lección 9: Mesas giratorias o un análogo de las tablas dinámicas en R

Fecha de publicación: 18 2020 mayo

Enlaces:

Descripción:
La mayoría de los usuarios de Excel utilizan tablas dinámicas; esta es una herramienta conveniente con la que puede convertir una serie de datos sin procesar en informes legibles en cuestión de segundos.

En este tutorial veremos cómo rotar tablas en R y convertirlas de formato ancho a largo y viceversa.

La mayor parte de la lección está dedicada al paquete. tidyr y funciones pivot_longer() и pivot_wider().

Lección 10: Carga de archivos JSON en R y conversión de listas en tablas

Fecha de publicación: 25 2020 mayo

Enlaces:

Descripción:
JSON y XML son formatos extremadamente populares para almacenar e intercambiar información, generalmente debido a su tamaño compacto.

Pero es difícil analizar los datos presentados en tales formatos, por lo que antes del análisis es necesario presentarlos en forma tabular, que es exactamente lo que aprenderemos en este video.

La lección está dedicada al paquete. tidyr, incluido en el núcleo de la biblioteca tidyversey funciones unnest_longer(), unnest_wider() и hoist().

Lección 11: Trazar rápidamente usando la función qplot()

Fecha de publicación: 1 2020 junio

Enlaces:

Descripción:
Paquete ggplot2 es una de las herramientas de visualización de datos más populares no solo en R.

En esta lección aprenderemos cómo construir gráficas simples usando la función qplot(), y analicemos todos sus argumentos.

Lección 12: Trazar gráficos capa por capa usando el paquete ggplot2

Fecha de publicación: 8 2020 junio

Enlaces:

Descripción:
La lección demuestra todo el poder del paquete. ggplot2 y la gramática de la construcción de gráficos en capas incrustadas en él.

Analizaremos las principales geometrías que están presentes en el paquete y aprenderemos cómo aplicar capas para construir un gráfico.

Conclusión

Intenté abordar la formación del programa del curso de la manera más concisa posible, para resaltar solo la información más necesaria que necesitará para dar los primeros pasos en el aprendizaje de una herramienta de análisis de datos tan poderosa como el lenguaje R.

El curso no es una guía exhaustiva para el análisis de datos utilizando R, pero le ayudará a comprender todas las técnicas necesarias para hacerlo.

Si bien el programa del curso está diseñado para 12 semanas, cada semana los lunes abriré el acceso a nuevas lecciones, por lo que recomiendo Suscribir en el canal de Youtube para no perderte la publicación de una nueva lección.

Fuente: habr.com

Añadir un comentario