Linguaxe R para usuarios de Excel (curso de vídeo gratuíto)
Debido á corentena, moitos pasan agora a maior parte do seu tempo na casa, e este tempo pode, e ata debería, gastalo de forma útil.
Ao comezo da corentena, decidín rematar uns proxectos que comecei hai uns meses. Un destes proxectos foi o curso de vídeo “R Language for Excel Users”. Con este curso, quería reducir a barreira para entrar en R e cubrir lixeiramente a escaseza existente de materiais de formación sobre este tema en ruso.
Se todo o traballo con datos na empresa na que traballa aínda se realiza en Excel, suxírolle que se familiarice cunha ferramenta de análise de datos máis moderna e, ao mesmo tempo, completamente gratuíta.
Contido
Se estás interesado na análise de datos, podes estar interesado no meu telegrama и youtube canles. A maior parte do contido está dedicado á linguaxe R.
O curso estrutúrase arredor da arquitectura tidyverse, e os paquetes incluídos nel: readr, vroom, dplyr, tidyr, ggplot2. Por suposto, hai outros bos paquetes en R que realizan operacións similares, por exemplo data.table, pero a sintaxe tidyverse intuitivo, fácil de ler incluso para un usuario sen formación, polo que creo que é mellor comezar a aprender a linguaxe R con tidyverse.
O curso guiarao a través de todas as operacións de análise de datos, desde a carga ata a visualización do resultado final.
Por que R e non Python? Debido a que R é unha linguaxe funcional, é máis fácil que os usuarios de Excel cambien a ela, porque sen necesidade de afondar na programación tradicional orientada a obxectos.
Polo momento, están previstas 12 clases de vídeo, cunha duración de 5 a 20 minutos cada unha.
As clases iranse abrindo aos poucos. Todos os luns abrirei o acceso a unha nova lección no meu sitio web. Canle de YouTube nunha lista de reprodución separada.
Para quen é este curso?
Creo que isto queda claro polo título, porén, describirei con máis detalle.
O curso está dirixido a aqueles que utilizan activamente Microsoft Excel no seu traballo e implementan alí todo o seu traballo con datos. En xeral, se abres a aplicación Microsoft Excel polo menos unha vez por semana, entón o curso é axeitado para ti.
Non é necesario ter habilidades de programación para completar o curso, porque... O curso está dirixido a principiantes.
Pero, quizais, a partir da lección 4, haberá tamén material interesante para os usuarios activos de R, porque... a funcionalidade principal de paquetes como dplyr и tidyr será discutido con certo detalle.
Programa do curso
Lección 1: Instalación da linguaxe R e do contorno de desenvolvemento RStudio
Descrición:
Unha lección introdutoria durante a cal descargaremos e instalaremos o software necesario, e examinaremos brevemente as capacidades e a interface do contorno de desenvolvemento RStudio.
Descrición:
Esta lección axudarache a comprender que estruturas de datos están dispoñibles na linguaxe R. Observaremos en detalle os vectores, os marcos de datas e as listas. Imos aprender a crealos e acceder aos seus elementos individuais.
Lección 3: Lectura de datos de ficheiros TSV, CSV, Excel e Google Sheets
Descrición:
O traballo con datos, independentemente da ferramenta, comeza coa súa extracción. Os paquetes utilízanse durante a lección vroom, readxl, googlesheets4 para cargar datos no contorno R desde ficheiros csv, tsv, Excel e Google Sheets.
Lección 4: Filtrar filas, seleccionar e renomear columnas, canalizacións en R
Descrición:
Neste vídeo seguimos coñecendo a biblioteca tidyverse e paquete dplyr.
Vexamos a familia de funcións mutate(), e aprenderemos a usalos para engadir novas columnas calculadas á táboa.
Descrición:
Esta lección está dedicada a unha das principais operacións de análise, agrupación e agregación de datos. Durante a lección empregaremos o paquete dplyr e características group_by() и summarise().
Observaremos toda a familia de funcións summarise(), é dicir summarise(), summarise_if() и summarise_at().
Lección 7: Unión vertical e horizontal de táboas en R
Descrición:
As funcións de fiestra teñen un significado semellante ás de agregación; tamén toman unha matriz de valores como entrada e realizan operacións aritméticas sobre eles, pero non cambian o número de filas no resultado de saída.
Neste tutorial seguimos estudando o paquete dplyr, e funcións group_by(), mutate(), así como novas cumsum(), lag(), lead() и arrange().
Lección 9: Táboas rotativas ou un análogo de táboas dinámicas en R
Descrición:
A maioría dos usuarios de Excel usan táboas dinámicas; esta é unha ferramenta conveniente coa que pode converter unha matriz de datos brutos en informes lexibles en cuestión de segundos.
Neste tutorial veremos como rotar táboas en R e convertelas de formato ancho a longo e viceversa.
A maior parte da lección está dedicada ao paquete tidyr e funcións pivot_longer() и pivot_wider().
Lección 10: Cargar ficheiros JSON en R e converter listas en táboas
Descrición:
JSON e XML son formatos moi populares para almacenar e intercambiar información, normalmente debido á súa compacidade.
Pero é difícil analizar os datos presentados en tales formatos, polo que antes da análise é necesario levalos a unha forma tabular, que é exactamente o que aprenderemos neste vídeo.
A lección está dedicada ao paquete tidyr, incluído no núcleo da biblioteca tidyverse, e funcións unnest_longer(), unnest_wider() и hoist().
Lección 11: Trazar rapidamente usando a función qplot().
Descrición:
A lección demostra todo o poder do paquete ggplot2 e a gramática da construción de gráficos en capas incrustadas nel.
Analizaremos as principais xeometrías que están presentes no paquete e aprenderemos a aplicar capas para construír un gráfico.
Conclusión
Tentei abordar a formación do programa do curso da forma máis concisa posible, para destacar só a información máis necesaria que necesitarás para dar os primeiros pasos na aprendizaxe dunha ferramenta de análise de datos tan poderosa como a linguaxe R.
O curso non é unha guía exhaustiva de análise de datos mediante a linguaxe R, pero axudarache a comprender todas as técnicas necesarias para iso.
Aínda que o programa do curso está deseñado para 12 semanas, todos os luns abrirei o acceso a novas leccións, polo que recomendo subscríbete na canle de YouTube para non perderse a publicación dunha nova lección.