Llenguatge R per a usuaris d'Excel (curs de vídeo gratuït)

A causa de la quarantena, ara molts passen la major part del seu temps a casa, i aquest temps es pot, i fins i tot s'hauria de gastar de manera útil.

A l'inici de la quarantena, vaig decidir acabar uns projectes que vaig començar fa uns mesos. Un d'aquests projectes va ser el videocurs "Llenguatge R per a usuaris d'Excel". Amb aquest curs, volia reduir la barrera d'accés a R i omplir lleugerament l'escassetat existent de materials de formació sobre aquest tema en rus.

Si tot el treball amb dades a l'empresa per a la qual treballeu encara es fa a Excel, us suggereixo que us familiaritzeu amb una eina d'anàlisi de dades més moderna i, alhora, completament gratuïta.

Llenguatge R per a usuaris d'Excel (curs de vídeo gratuït)

Contingut

Si esteu interessats en l'anàlisi de dades, potser us interessa el meu telegram и youtube canals. La major part del contingut està dedicat al llenguatge R.

  1. Referències
  2. Sobre el curs
  3. Per a qui va aquest curs?
  4. Programa del curs
    4.1. Lliçó 1: Instal·lació del llenguatge R i l'entorn de desenvolupament RStudio
    4.2. Lliçó 2: Estructures bàsiques de dades a R
    4.3. Lliçó 3: Llegir dades de fitxers TSV, CSV, Excel i Fulls de càlcul de Google
    4.4. Lliçó 4: filtrar files, seleccionar i canviar el nom de columnes, canalitzacions a R
    4.5. Lliçó 5: Addició de columnes calculades a una taula a R
    4.6. Lliçó 6: Agrupar i agregar dades a R
    4.7. Lliçó 7: Unió vertical i horitzontal de taules a R
    4.8. Lliçó 8: Funcions de la finestra a R
    4.9. Lliçó 9: Taules rotatives o un anàleg de taules dinàmiques a R
    4.10. Lliçó 10: Carregar fitxers JSON a R i convertir llistes en taules
    4.11. Lliçó 11: Traçant ràpidament utilitzant la funció qplot().
    4.12. Lliçó 12: Traçar gràfics capa per capa utilitzant el paquet ggplot2
  5. Conclusió

Referències

Sobre el curs

El curs s'estructura al voltant de l'arquitectura tidyverse, i els paquets que s'hi inclouen: readr, vroom, dplyr, tidyr, ggplot2. Per descomptat, hi ha altres bons paquets a R que fan operacions similars, per exemple data.table, però la sintaxi tidyverse intuïtiu, fàcil de llegir fins i tot per a un usuari sense formació, així que crec que és millor començar a aprendre el llenguatge R amb tidyverse.

El curs us guiarà a través de totes les operacions d'anàlisi de dades, des de la càrrega fins a la visualització del resultat final.

Per què R i no Python? Com que R és un llenguatge funcional, és més fàcil per als usuaris d'Excel canviar-hi, perquè no cal aprofundir en la programació tradicional orientada a objectes.

De moment, s'han previst 12 lliçons de vídeo, d'entre 5 i 20 minuts cadascuna.

Les classes s'obriran gradualment. Cada dilluns obriré l'accés a una nova lliçó al meu lloc web. Canal de YouTube en una llista de reproducció independent.

Per a qui va aquest curs?

Crec que això queda clar pel títol, però ho descriuré amb més detall.

El curs està dirigit a aquells que utilitzen activament Microsoft Excel en la seva feina i hi implementen tot el seu treball amb dades. En general, si obriu l'aplicació Microsoft Excel almenys un cop a la setmana, el curs és adequat per a vosaltres.

No cal tenir habilitats de programació per completar el curs, perquè... El curs està adreçat a principiants.

Però, potser, a partir de la lliçó 4, també hi haurà material interessant per als usuaris actius de R, perquè... la funcionalitat principal de paquets com dplyr и tidyr es parlarà amb cert detall.

Programa del curs

Lliçó 1: Instal·lació del llenguatge R i l'entorn de desenvolupament RStudio

Data de publicació: Març 23 2020

Enllaços:

Vídeo:

Descripció:
Una lliçó introductòria durant la qual descarregarem i instal·larem el programari necessari, i examinarem breument les capacitats i la interfície de l'entorn de desenvolupament RStudio.

Lliçó 2: Estructures bàsiques de dades a R

Data de publicació: Març 30 2020

Enllaços:

Vídeo:

Descripció:
Aquesta lliçó us ajudarà a entendre quines estructures de dades estan disponibles en el llenguatge R. Veurem en detall els vectors, els marcs de dates i les llistes. Aprenem a crear-los i accedir als seus elements individuals.

Lliçó 3: Llegir dades de fitxers TSV, CSV, Excel i Fulls de càlcul de Google

Data de publicació: Abril 6 2020

Enllaços:

Vídeo:

Descripció:
El treball amb dades, independentment de l'eina, comença amb la seva extracció. Els paquets s'utilitzen durant la lliçó vroom, readxl, googlesheets4 per carregar dades a l'entorn R des de fitxers csv, tsv, Excel i Fulls de càlcul de Google.

Lliçó 4: filtrar files, seleccionar i canviar el nom de columnes, canalitzacions a R

Data de publicació: Abril 13 2020

Enllaços:

Vídeo:

Descripció:
Aquesta lliçó tracta sobre el paquet dplyr. En ella descobrirem com filtrar marcs de dades, seleccionar les columnes necessàries i canviar-les el nom.

També aprendrem què són les pipelines i com ajuden a fer que el vostre codi R sigui més llegible.

Lliçó 5: Addició de columnes calculades a una taula a R

Data de publicació: Abril 20 2020

Enllaços:

Vídeo:

Descripció:
En aquest vídeo continuem el nostre coneixement de la biblioteca tidyverse i paquet dplyr.
Vegem la família de funcions mutate(), i aprendrem a utilitzar-los per afegir noves columnes calculades a la taula.

Lliçó 6: Agrupar i agregar dades a R

Data de publicació: Abril 27 2020

Enllaços:

Vídeo:

Descripció:
Aquesta lliçó està dedicada a una de les principals operacions d'anàlisi, agrupació i agregació de dades. Durant la lliçó utilitzarem el paquet dplyr i característiques group_by() и summarise().

Veurem tota la família de funcions summarise()és a dir. summarise(), summarise_if() и summarise_at().

Lliçó 7: Unió vertical i horitzontal de taules a R

Data de publicació: Mai 4 2020

Enllaços:

Vídeo:

Descripció:
Aquesta lliçó us ajudarà a comprendre les operacions d'unió vertical i horitzontal de taules.

Una unió vertical és l'equivalent a l'operació UNION en el llenguatge de consulta SQL.

La unió horitzontal és més coneguda pels usuaris d'Excel gràcies a la funció VLOOKUP; en SQL, aquestes operacions les realitza l'operador JOIN.

Durant la lliçó resoldrem un problema pràctic durant el qual utilitzarem paquets dplyr, readxl, tidyr и stringr.

Les principals funcions que tindrem en compte:

  • bind_rows() - unió vertical de taules
  • left_join() - unió horitzontal de taules
  • semi_join() - incloses les taules d'unió
  • anti_join() - Unió exclusiva a la taula

Lliçó 8: Funcions de la finestra a R

Data de publicació: Mai 11 2020

Enllaços:

Descripció:
Les funcions de finestra tenen un significat similar a les d'agregació; també prenen una matriu de valors com a entrada i realitzen operacions aritmètiques sobre elles, però no canvien el nombre de files en el resultat de sortida.

En aquest tutorial continuem estudiant el paquet dplyr, i funcions group_by(), mutate(), així com noves cumsum(), lag(), lead() и arrange().

Lliçó 9: Taules rotatives o un anàleg de taules dinàmiques a R

Data de publicació: Mai 18 2020

Enllaços:

Descripció:
La majoria dels usuaris d'Excel utilitzen taules dinàmiques; aquesta és una eina convenient amb la qual podeu convertir una sèrie de dades en brut en informes llegibles en qüestió de segons.

En aquest tutorial veurem com girar taules en R i convertir-les de format ample a format llarg i viceversa.

La major part de la lliçó està dedicada al paquet tidyr i funcions pivot_longer() и pivot_wider().

Lliçó 10: Carregar fitxers JSON a R i convertir llistes en taules

Data de publicació: Mai 25 2020

Enllaços:

Descripció:
JSON i XML són formats extremadament populars per emmagatzemar i intercanviar informació, generalment a causa de la seva compacitat.

Però és difícil analitzar les dades presentades en aquests formats, de manera que abans de l'anàlisi cal portar-les en forma tabular, que és exactament el que aprendrem en aquest vídeo.

La lliçó està dedicada al paquet tidyr, inclòs en el nucli de la biblioteca tidyverse, i funcions unnest_longer(), unnest_wider() и hoist().

Lliçó 11: Traçant ràpidament utilitzant la funció qplot().

Data de publicació: Juny 1 2020

Enllaços:

Descripció:
Paquet ggplot2 és una de les eines de visualització de dades més populars no només a R.

En aquesta lliçó aprendrem a construir gràfics senzills mitjançant la funció qplot(), i analitzem tots els seus arguments.

Lliçó 12: Traçar gràfics capa per capa utilitzant el paquet ggplot2

Data de publicació: Juny 8 2020

Enllaços:

Descripció:
La lliçó demostra tot el poder del paquet ggplot2 i la gramàtica de la construcció de gràfics en capes incrustades.

Analitzarem les principals geometries que hi ha presents al paquet i aprendrem a aplicar capes per construir un gràfic.

Conclusió

He intentat abordar la formació del programa del curs de la manera més concisa possible, per destacar només la informació més necessària que necessitareu per donar els primers passos en l'aprenentatge d'una eina d'anàlisi de dades tan potent com el llenguatge R.

El curs no és una guia exhaustiva per a l'anàlisi de dades amb el llenguatge R, però us ajudarà a comprendre totes les tècniques necessàries per a això.

Tot i que el programa del curs està dissenyat per a 12 setmanes, cada setmana els dilluns obriré l'accés a noves lliçons, així que recomano subscriure al canal de YouTube per no perdre's la publicació d'una nova lliçó.

Font: www.habr.com

Afegeix comentari