Pro la kvaranteno, multaj homoj nun pasigas la plej grandan parton de sia tempo hejme, kaj ĉi tiu tempo povas kaj eĉ devus esti elspezata utile.
Komence de la kvaranteno, mi decidis fini kelkajn projektojn, kiujn mi komencis antaŭ kelkaj monatoj. Unu el ĉi tiuj projektoj estis la videokurso "Lingvo R por Excel-uzantoj". Per ĉi tiu kurso, mi volis malaltigi la alirsojlon al R, kaj plenigi la ekzistantan mankon de trejnaj materialoj pri ĉi tiu temo en la rusa lingvo.
Se ĉiu laboro kun datumoj en la firmao, por kiu vi laboras, ankoraŭ estas farata per Excel, tiam mi sugestas, ke vi konatiĝu kun pli moderna kaj samtempe tute senpaga datumanaliza ilo.

Enhavo
Se vi interesiĝas pri datuma analizo, vi eble interesiĝos pri mia и kanaloj. La plej granda parto de kies enhavo estas dediĉita al la R-lingvo.
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
4.10.
4.11.
4.12.
referencoj
Pri la kurso
La kurso estas konstruita ĉirkaŭ arkitekturo. tidyverse, kaj la pakaĵoj inkluzivitaj en ĝi: readr, vroom, dplyr, tidyr, ggplot2Kompreneble, ekzistas aliaj bonaj pakaĵoj en R, kiuj plenumas similajn operaciojn, ekzemple data.table, sed la sintakso tidyverse Ĝi estas intuicia, facile legebla eĉ por nepreparita uzanto, do mi opinias, ke estas pli bone komenci lerni la lingvon R per tidyverse.
La kurso gvidos vin tra ĉiuj datumanalizaj operacioj, de ŝargado ĝis bildigo de la fina rezulto.
Kial R kaj ne Python? Ĉar R estas funkcia lingvo, estas pli facile por Excel-uzantoj ŝanĝi al ĝi, ĉar ili ne bezonas plonĝi en tradician objektorientitan programadon.
Nuntempe, 12 videolecionoj estas planitaj, ĉiu daŭranta de 5 ĝis 20 minutojn.
Lecionoj estos malfermitaj iom post iom. Ĉiun lundon mi malfermos aliron al nova leciono en mia en aparta kantlisto.
Por kiu estas ĉi tiu kurso?
Mi kredas, ke ĝi estas klara el la titolo, tamen mi priskribos ĝin pli detale.
La kurso celas tiujn, kiuj aktive uzas Microsoft Excel en sia laboro kaj tie efektivigas ĉian laboron kun datumoj. Ĝenerale, se vi malfermas la aplikaĵon Microsoft Excel almenaŭ unufoje semajne, la kurso taŭgos por vi.
Vi ne bezonas programajn kapablojn por fini la kurson, ĉar la kurso celas komencantojn.
Sed, eble komencante de leciono 4, estos materialo interesa por aktivaj R-uzantoj, ĉar la ĉefa funkcio de tiaj pakaĵoj kiel dplyr и tidyr estos konsiderata sufiĉe detale.
Kursprogramo
Leciono 1: Instali R kaj RStudio
Eldondato: Marto 23 2020
Referencoj
Video:

Priskribo:
Enkonduka leciono dum kiu ni elŝutos kaj instalos la necesan programaron, kaj mallonge ekzamenos la kapablojn kaj interfacon de la programista medio RStudio.
Leciono 2: Bazaj Datenstrukturoj en R
Eldondato: Marto 30 2020
Referencoj
Video:

Priskribo:
Ĉi tiu leciono helpos vin kompreni, kiaj datenstrukturoj estas en la lingvo R. Ni detale ekzamenos vektorojn, datenkadrojn kaj listojn. Ni lernos kiel krei ilin kaj aliri iliajn individuajn elementojn.
Leciono 3: Legado de datumoj el TSV, CSV, Excel-dosieroj kaj Google Sheets
Eldondato: Aprilo 6 2020
Referencoj
Video:

Priskribo:
Laborado kun datumoj, sendepende de la ilo, komenciĝas per ilia eltiro. Dum la leciono, pakaĵoj estas uzataj vroom, readxl, googlesheets4 ŝargi datumojn en la R-medion el csv, tsv, Excel-dosieroj kaj Google Sheets.
Leciono 4: Filtrado de vicoj, selektado kaj renomado de kolumnoj, duktoj en R
Eldondato: Aprilo 13 2020
Referencoj
Video:

Priskribo:
Ĉi tiu leciono temas pri la pakaĵo dplyrEn ĝi, ni eltrovos kiel filtri datumkadrojn, elekti la necesajn kolumnojn kaj renomi ilin.
Ni ankaŭ lernos, kio estas duktoj kaj kiel ili helpas igi vian R-kodon pli legebla.
Leciono 5: Aldonado de Kalkulitaj Kolumnoj al Tabelo en R
Eldondato: Aprilo 20 2020
Referencoj
Video:

Priskribo:
En ĉi tiu filmeto ni daŭrigas nian enkondukon al la biblioteko tidyverse kaj pakaĵo dplyr.
Ni analizu la familion de funkcioj mutate(), kaj ni lernos kiel uzi ilin por aldoni novajn kalkulitajn kolumnojn al la tabelo.
Leciono 6: Grupigo kaj Agrego de Datumoj en R
Eldondato: Aprilo 27 2020
Referencoj
Video:

Priskribo:
Ĉi tiu leciono estas dediĉita al unu el la bazaj operacioj de datumanalizo, grupigo kaj agregado. Dum la leciono ni uzos la pakaĵon dplyr kaj funkcioj group_by() и summarise().
Ni konsideros la tutan familion de funkcioj. summarise(), t.e. summarise(), summarise_if() и summarise_at().
Leciono 7: Vertikala kaj Horizontala Kunigo de Tabeloj en R
Eldondato: 4 majo 2020
Referencoj
Video:

Priskribo:
Ĉi tiu lernilo helpos vin kompreni la vertikalajn kaj horizontalajn tabelkunigajn operaciojn.
Vertikala kunigo estas analoga al la UNIO-operacio en la SQL-serĉlingvo.
Horizontala kunigo estas pli konata al Excel-uzantoj danke al la funkcio VLOOKUP, en SQL tiaj operacioj estas plenumataj per la KUNIG-operatoro.
Dum la leciono ni solvos praktikan problemon en kiu ni uzos pakaĵojn dplyr, readxl, tidyr и stringr.
La ĉefaj funkcioj, kiujn ni konsideros, estas:
bind_rows()- vertikala tabelkunigoleft_join()- horizontala tabelkunigosemi_join()- inkluzive de tabelkunigoanti_join()- ekskluziva tabelkunigo
Leciono 8: Fenestraj funkcioj en R
Eldondato: 11 majo 2020
Referencoj
Priskribo:
Fenestraj funkcioj havas similan signifon al agregaj funkcioj; ili ankaŭ prenas aron da valoroj kiel enigaĵon kaj plenumas aritmetikajn operaciojn sur ili, sed ne ŝanĝas la nombron da vicoj en la elira rezulto.
En ĉi tiu lernilo ni daŭre esploras la pakaĵon dplyr, kaj funkcioj group_by(), mutate(), same kiel novaj cumsum(), lag(), lead() и arrange().
Leciono 9: Pivotaj tabeloj aŭ la ekvivalento de pivotaj tabeloj en R
Eldondato: 18 majo 2020
Referencoj
Priskribo:
Plej multaj Excel-uzantoj uzas pivottabelojn, oportunan ilon kiu permesas al vi transformi tunon da krudaj datumoj en legeblajn raportojn en sekundoj.
En ĉi tiu lernilo ni rigardos kiel rotacii tabelojn en R, kaj konverti ilin de larĝa al longa formato kaj inverse.
Plejparto de la leciono estas dediĉita al la pakaĵo tidyr kaj funkcioj pivot_longer() и pivot_wider().
Leciono 10: Ŝarĝi JSON-dosierojn en R kaj konverti listojn al tabeloj
Eldondato: 25 majo 2020
Referencoj
Priskribo:
JSON kaj XML estas ekstreme popularaj formatoj por stokado kaj interŝanĝado de informoj, kutime pro ilia kompakteco.
Sed malfacilas analizi datumojn prezentitajn en tiaj formatoj, do antaŭ ol analizi ilin, necesas konverti ilin en tabelan formon, kion ni lernos en ĉi tiu filmeto.
La leciono estas dediĉita al la pakaĵo tidyr, kiu estas parto de la biblioteka kerno tidyverse, kaj funkcioj unnest_longer(), unnest_wider() и hoist().
Leciono 11: Rapide desegni grafikaĵojn per qplot()
Eldondato: 1 2020 junio
Referencoj
Priskribo:
Pako ggplot2 estas unu el la plej popularaj datumbildigaj iloj ne nur en R.
En ĉi tiu leciono ni lernos kiel desegni simplajn grafikaĵojn uzante la funkcion qplot(), kaj ni analizos ĉiujn ĝiajn argumentojn.
Leciono 12: Dezajnado Tavolon post Tavolo per la Pakaĵo ggplot2
Eldondato: 8 2020 junio
Referencoj
Priskribo:
La leciono montras la plenan potencon de la pakaĵo. ggplot2 kaj la gramatiko de konstruado de grafeoj en tavoloj enigitaj en ĝin.
Ni analizos la bazajn geometriojn, kiuj ĉeestas en la pakaĵo, kaj lernos kiel supermeti tavolojn por konstrui grafeon.
konkludo
Mi provis alproksimiĝi al la formado de la kursprogramo kiel eble plej koncize, por reliefigi nur la plej necesajn informojn, kiujn vi bezonos por fari la unuajn paŝojn en lernado de tia potenca datumanaliza ilo kiel la lingvo R.
Ĉi tiu kurso ne estas ampleksa gvidilo pri datumanalizo uzante R, sed ĝi helpos vin kompreni ĉiujn teknikojn, kiujn vi bezonas por fari tion.
Nuntempe, la kursprogramo estas desegnita por 12 semajnoj, ĉiusemajne, lundojn, mi malfermos aliron al novaj lecionoj, do mi rekomendas en YouTube-kanalo, por ne maltrafi la publikigon de nova leciono.
fonto: www.habr.com
