Linguaxe R para usuarios de Excel (curso de vídeo gratuíto)

Debido á corentena, moitos pasan agora a maior parte do seu tempo na casa, e este tempo pode, e ata debería, gastalo de forma útil.

Ao comezo da corentena, decidín rematar uns proxectos que comecei hai uns meses. Un destes proxectos foi o curso de vídeo “R Language for Excel Users”. Con este curso, quería reducir a barreira para entrar en R e cubrir lixeiramente a escaseza existente de materiais de formación sobre este tema en ruso.

Se todo o traballo con datos na empresa na que traballa aínda se realiza en Excel, suxírolle que se familiarice cunha ferramenta de análise de datos máis moderna e, ao mesmo tempo, completamente gratuíta.

Linguaxe R para usuarios de Excel (curso de vídeo gratuíto)

Contido

Se estás interesado na análise de datos, podes estar interesado no meu telegrama и youtube canles. A maior parte do contido está dedicado á linguaxe R.

  1. referencias
  2. Sobre o curso
  3. Para quen é este curso?
  4. Programa do curso
    4.1. Lección 1: Instalación da linguaxe R e do contorno de desenvolvemento RStudio
    4.2. Lección 2: Estruturas básicas de datos en R
    4.3. Lección 3: Lectura de datos de ficheiros TSV, CSV, Excel e Google Sheets
    4.4. Lección 4: Filtrar filas, seleccionar e renomear columnas, canalizacións en R
    4.5. Lección 5: Engadir columnas calculadas a unha táboa en R
    4.6. Lección 6: Agrupación e agregación de datos en R
    4.7. Lección 7: Unión vertical e horizontal de táboas en R
    4.8. Lección 8: funcións da fiestra en R
    4.9. Lección 9: Táboas rotativas ou un análogo de táboas dinámicas en R
    4.10. Lección 10: Cargar ficheiros JSON en R e converter listas en táboas
    4.11. Lección 11: Trazar rapidamente usando a función qplot().
    4.12. Lección 12: Trazar gráficos capa por capa usando o paquete ggplot2
  5. Conclusión

referencias

Sobre o curso

O curso estrutúrase arredor da arquitectura tidyverse, e os paquetes incluídos nel: readr, vroom, dplyr, tidyr, ggplot2. Por suposto, hai outros bos paquetes en R que realizan operacións similares, por exemplo data.table, pero a sintaxe tidyverse intuitivo, fácil de ler incluso para un usuario sen formación, polo que creo que é mellor comezar a aprender a linguaxe R con tidyverse.

O curso guiarao a través de todas as operacións de análise de datos, desde a carga ata a visualización do resultado final.

Por que R e non Python? Debido a que R é unha linguaxe funcional, é máis fácil que os usuarios de Excel cambien a ela, porque sen necesidade de afondar na programación tradicional orientada a obxectos.

Polo momento, están previstas 12 clases de vídeo, cunha duración de 5 a 20 minutos cada unha.

As clases iranse abrindo aos poucos. Todos os luns abrirei o acceso a unha nova lección no meu sitio web. Canle de YouTube nunha lista de reprodución separada.

Para quen é este curso?

Creo que isto queda claro polo título, porén, describirei con máis detalle.

O curso está dirixido a aqueles que utilizan activamente Microsoft Excel no seu traballo e implementan alí todo o seu traballo con datos. En xeral, se abres a aplicación Microsoft Excel polo menos unha vez por semana, entón o curso é axeitado para ti.

Non é necesario ter habilidades de programación para completar o curso, porque... O curso está dirixido a principiantes.

Pero, quizais, a partir da lección 4, haberá tamén material interesante para os usuarios activos de R, porque... a funcionalidade principal de paquetes como dplyr и tidyr será discutido con certo detalle.

Programa do curso

Lección 1: Instalación da linguaxe R e do contorno de desenvolvemento RStudio

Data de publicación: Marzo 23 2020

Referencias:

Vídeo:

Descrición:
Unha lección introdutoria durante a cal descargaremos e instalaremos o software necesario, e examinaremos brevemente as capacidades e a interface do contorno de desenvolvemento RStudio.

Lección 2: Estruturas básicas de datos en R

Data de publicación: Marzo 30 2020

Referencias:

Vídeo:

Descrición:
Esta lección axudarache a comprender que estruturas de datos están dispoñibles na linguaxe R. Observaremos en detalle os vectores, os marcos de datas e as listas. Imos aprender a crealos e acceder aos seus elementos individuais.

Lección 3: Lectura de datos de ficheiros TSV, CSV, Excel e Google Sheets

Data de publicación: Abril 6 2020

Referencias:

Vídeo:

Descrición:
O traballo con datos, independentemente da ferramenta, comeza coa súa extracción. Os paquetes utilízanse durante a lección vroom, readxl, googlesheets4 para cargar datos no contorno R desde ficheiros csv, tsv, Excel e Google Sheets.

Lección 4: Filtrar filas, seleccionar e renomear columnas, canalizacións en R

Data de publicación: Abril 13 2020

Referencias:

Vídeo:

Descrición:
Esta lección trata sobre o paquete dplyr. Nel descubriremos como filtrar marcos de datos, seleccionar as columnas necesarias e renomealas.

Tamén aprenderemos que son as canalizacións e como axudan a que o teu código R sexa máis lexible.

Lección 5: Engadir columnas calculadas a unha táboa en R

Data de publicación: Abril 20 2020

Referencias:

Vídeo:

Descrición:
Neste vídeo seguimos coñecendo a biblioteca tidyverse e paquete dplyr.
Vexamos a familia de funcións mutate(), e aprenderemos a usalos para engadir novas columnas calculadas á táboa.

Lección 6: Agrupación e agregación de datos en R

Data de publicación: Abril 27 2020

Referencias:

Vídeo:

Descrición:
Esta lección está dedicada a unha das principais operacións de análise, agrupación e agregación de datos. Durante a lección empregaremos o paquete dplyr e características group_by() и summarise().

Observaremos toda a familia de funcións summarise(), é dicir summarise(), summarise_if() и summarise_at().

Lección 7: Unión vertical e horizontal de táboas en R

Data de publicación: Maio 4 2020

Referencias:

Vídeo:

Descrición:
Esta lección axudarache a comprender as operacións de unión vertical e horizontal de táboas.

Unha unión vertical é o equivalente á operación UNION na linguaxe de consulta SQL.

A unión horizontal é máis coñecida polos usuarios de Excel grazas á función VLOOKUP; en SQL, tales operacións son realizadas polo operador JOIN.

Durante a lección resolveremos un problema práctico durante o cal empregaremos paquetes dplyr, readxl, tidyr и stringr.

As principais funcións que teremos en conta:

  • bind_rows() - Unión vertical de táboas
  • left_join() - Unión horizontal de táboas
  • semi_join() - incluíndo mesas de unión
  • anti_join() - Unirse á mesa exclusiva

Lección 8: funcións da fiestra en R

Data de publicación: Maio 11 2020

Referencias:

Descrición:
As funcións de fiestra teñen un significado semellante ás de agregación; tamén toman unha matriz de valores como entrada e realizan operacións aritméticas sobre eles, pero non cambian o número de filas no resultado de saída.

Neste tutorial seguimos estudando o paquete dplyr, e funcións group_by(), mutate(), así como novas cumsum(), lag(), lead() и arrange().

Lección 9: Táboas rotativas ou un análogo de táboas dinámicas en R

Data de publicación: Maio 18 2020

Referencias:

Descrición:
A maioría dos usuarios de Excel usan táboas dinámicas; esta é unha ferramenta conveniente coa que pode converter unha matriz de datos brutos en informes lexibles en cuestión de segundos.

Neste tutorial veremos como rotar táboas en R e convertelas de formato ancho a longo e viceversa.

A maior parte da lección está dedicada ao paquete tidyr e funcións pivot_longer() и pivot_wider().

Lección 10: Cargar ficheiros JSON en R e converter listas en táboas

Data de publicación: Maio 25 2020

Referencias:

Descrición:
JSON e XML son formatos moi populares para almacenar e intercambiar información, normalmente debido á súa compacidade.

Pero é difícil analizar os datos presentados en tales formatos, polo que antes da análise é necesario levalos a unha forma tabular, que é exactamente o que aprenderemos neste vídeo.

A lección está dedicada ao paquete tidyr, incluído no núcleo da biblioteca tidyverse, e funcións unnest_longer(), unnest_wider() и hoist().

Lección 11: Trazar rapidamente usando a función qplot().

Data de publicación: Xuño 1 2020

Referencias:

Descrición:
Paquete ggplot2 é unha das ferramentas de visualización de datos máis populares non só en R.

Nesta lección aprenderemos a construír gráficos sinxelos usando a función qplot(), e analicemos todos os seus argumentos.

Lección 12: Trazar gráficos capa por capa usando o paquete ggplot2

Data de publicación: Xuño 8 2020

Referencias:

Descrición:
A lección demostra todo o poder do paquete ggplot2 e a gramática da construción de gráficos en capas incrustadas nel.

Analizaremos as principais xeometrías que están presentes no paquete e aprenderemos a aplicar capas para construír un gráfico.

Conclusión

Tentei abordar a formación do programa do curso da forma máis concisa posible, para destacar só a información máis necesaria que necesitarás para dar os primeiros pasos na aprendizaxe dunha ferramenta de análise de datos tan poderosa como a linguaxe R.

O curso non é unha guía exhaustiva de análise de datos mediante a linguaxe R, pero axudarache a comprender todas as técnicas necesarias para iso.

Aínda que o programa do curso está deseñado para 12 semanas, todos os luns abrirei o acceso a novas leccións, polo que recomendo subscríbete na canle de YouTube para non perderse a publicación dunha nova lección.

Fonte: www.habr.com

Engadir un comentario