Llenguatge R per a usuaris d'Excel (curs de vídeo gratuït)
A causa de la quarantena, ara molts passen la major part del seu temps a casa, i aquest temps es pot, i fins i tot s'hauria de gastar de manera útil.
A l'inici de la quarantena, vaig decidir acabar uns projectes que vaig començar fa uns mesos. Un d'aquests projectes va ser el videocurs "Llenguatge R per a usuaris d'Excel". Amb aquest curs, volia reduir la barrera d'accés a R i omplir lleugerament l'escassetat existent de materials de formació sobre aquest tema en rus.
Si tot el treball amb dades a l'empresa per a la qual treballeu encara es fa a Excel, us suggereixo que us familiaritzeu amb una eina d'anàlisi de dades més moderna i, alhora, completament gratuïta.
Contingut
Si esteu interessats en l'anàlisi de dades, potser us interessa el meu telegram и youtube canals. La major part del contingut està dedicat al llenguatge R.
El curs s'estructura al voltant de l'arquitectura tidyverse, i els paquets que s'hi inclouen: readr, vroom, dplyr, tidyr, ggplot2. Per descomptat, hi ha altres bons paquets a R que fan operacions similars, per exemple data.table, però la sintaxi tidyverse intuïtiu, fàcil de llegir fins i tot per a un usuari sense formació, així que crec que és millor començar a aprendre el llenguatge R amb tidyverse.
El curs us guiarà a través de totes les operacions d'anàlisi de dades, des de la càrrega fins a la visualització del resultat final.
Per què R i no Python? Com que R és un llenguatge funcional, és més fàcil per als usuaris d'Excel canviar-hi, perquè no cal aprofundir en la programació tradicional orientada a objectes.
De moment, s'han previst 12 lliçons de vídeo, d'entre 5 i 20 minuts cadascuna.
Les classes s'obriran gradualment. Cada dilluns obriré l'accés a una nova lliçó al meu lloc web. Canal de YouTube en una llista de reproducció independent.
Per a qui va aquest curs?
Crec que això queda clar pel títol, però ho descriuré amb més detall.
El curs està dirigit a aquells que utilitzen activament Microsoft Excel en la seva feina i hi implementen tot el seu treball amb dades. En general, si obriu l'aplicació Microsoft Excel almenys un cop a la setmana, el curs és adequat per a vosaltres.
No cal tenir habilitats de programació per completar el curs, perquè... El curs està adreçat a principiants.
Però, potser, a partir de la lliçó 4, també hi haurà material interessant per als usuaris actius de R, perquè... la funcionalitat principal de paquets com dplyr и tidyr es parlarà amb cert detall.
Programa del curs
Lliçó 1: Instal·lació del llenguatge R i l'entorn de desenvolupament RStudio
Descripció:
Una lliçó introductòria durant la qual descarregarem i instal·larem el programari necessari, i examinarem breument les capacitats i la interfície de l'entorn de desenvolupament RStudio.
Descripció:
Aquesta lliçó us ajudarà a entendre quines estructures de dades estan disponibles en el llenguatge R. Veurem en detall els vectors, els marcs de dates i les llistes. Aprenem a crear-los i accedir als seus elements individuals.
Lliçó 3: Llegir dades de fitxers TSV, CSV, Excel i Fulls de càlcul de Google
Descripció:
El treball amb dades, independentment de l'eina, comença amb la seva extracció. Els paquets s'utilitzen durant la lliçó vroom, readxl, googlesheets4 per carregar dades a l'entorn R des de fitxers csv, tsv, Excel i Fulls de càlcul de Google.
Lliçó 4: filtrar files, seleccionar i canviar el nom de columnes, canalitzacions a R
Descripció:
Aquesta lliçó tracta sobre el paquet dplyr. En ella descobrirem com filtrar marcs de dades, seleccionar les columnes necessàries i canviar-les el nom.
També aprendrem què són les pipelines i com ajuden a fer que el vostre codi R sigui més llegible.
Lliçó 5: Addició de columnes calculades a una taula a R
Descripció:
En aquest vídeo continuem el nostre coneixement de la biblioteca tidyverse i paquet dplyr.
Vegem la família de funcions mutate(), i aprendrem a utilitzar-los per afegir noves columnes calculades a la taula.
Descripció:
Aquesta lliçó està dedicada a una de les principals operacions d'anàlisi, agrupació i agregació de dades. Durant la lliçó utilitzarem el paquet dplyr i característiques group_by() и summarise().
Veurem tota la família de funcions summarise()és a dir. summarise(), summarise_if() и summarise_at().
Lliçó 7: Unió vertical i horitzontal de taules a R
Descripció:
Les funcions de finestra tenen un significat similar a les d'agregació; també prenen una matriu de valors com a entrada i realitzen operacions aritmètiques sobre elles, però no canvien el nombre de files en el resultat de sortida.
En aquest tutorial continuem estudiant el paquet dplyr, i funcions group_by(), mutate(), així com noves cumsum(), lag(), lead() и arrange().
Lliçó 9: Taules rotatives o un anàleg de taules dinàmiques a R
Descripció:
La majoria dels usuaris d'Excel utilitzen taules dinàmiques; aquesta és una eina convenient amb la qual podeu convertir una sèrie de dades en brut en informes llegibles en qüestió de segons.
En aquest tutorial veurem com girar taules en R i convertir-les de format ample a format llarg i viceversa.
La major part de la lliçó està dedicada al paquet tidyr i funcions pivot_longer() и pivot_wider().
Lliçó 10: Carregar fitxers JSON a R i convertir llistes en taules
Descripció:
JSON i XML són formats extremadament populars per emmagatzemar i intercanviar informació, generalment a causa de la seva compacitat.
Però és difícil analitzar les dades presentades en aquests formats, de manera que abans de l'anàlisi cal portar-les en forma tabular, que és exactament el que aprendrem en aquest vídeo.
La lliçó està dedicada al paquet tidyr, inclòs en el nucli de la biblioteca tidyverse, i funcions unnest_longer(), unnest_wider() и hoist().
Lliçó 11: Traçant ràpidament utilitzant la funció qplot().
Descripció:
La lliçó demostra tot el poder del paquet ggplot2 i la gramàtica de la construcció de gràfics en capes incrustades.
Analitzarem les principals geometries que hi ha presents al paquet i aprendrem a aplicar capes per construir un gràfic.
Conclusió
He intentat abordar la formació del programa del curs de la manera més concisa possible, per destacar només la informació més necessària que necessitareu per donar els primers passos en l'aprenentatge d'una eina d'anàlisi de dades tan potent com el llenguatge R.
El curs no és una guia exhaustiva per a l'anàlisi de dades amb el llenguatge R, però us ajudarà a comprendre totes les tècniques necessàries per a això.
Tot i que el programa del curs està dissenyat per a 12 setmanes, cada setmana els dilluns obriré l'accés a noves lliçons, així que recomano subscriure al canal de YouTube per no perdre's la publicació d'una nova lliçó.