Gjuha R për përdoruesit e Excel (kurs video falas)

Për shkak të karantinës, shumë tani kalojnë pjesën e luanit të kohës së tyre në shtëpi, dhe kjo kohë mund dhe madje duhet të shpenzohet në mënyrë të dobishme.

Në fillim të karantinës vendosa të përfundoj disa projekte që i kam nisur disa muaj më parë. Një nga këto projekte ishte kursi video “R Gjuha për përdoruesit e Excel”. Me këtë kurs, doja të ulja pengesën për hyrjen në R dhe të plotësoja pak mungesën ekzistuese të materialeve trajnuese për këtë temë në Rusisht.

Nëse e gjithë puna me të dhënat në kompaninë ku punoni vazhdon ende në Excel, atëherë ju sugjeroj të njiheni me një mjet më modern dhe në të njëjtën kohë plotësisht falas për analizën e të dhënave.

Gjuha R për përdoruesit e Excel (kurs video falas)

Përmbajtje

Nëse jeni të interesuar për analizën e të dhënave, mund të jeni të interesuar për mua telegram и youtube kanalet. Pjesa më e madhe e përmbajtjes i kushtohet gjuhës R.

  1. Referencat
  2. Rreth kursit
  3. Për kë është ky kurs?
  4. Programi i kursit
    4.1. Mësimi 1: Instalimi i gjuhës R dhe mjedisit të zhvillimit RStudio
    4.2. Mësimi 2: Strukturat bazë të të dhënave në R
    4.3. Mësimi 3: Leximi i të dhënave nga skedarët TSV, CSV, Excel dhe Google Sheets
    4.4. Mësimi 4: Filtrimi i rreshtave, përzgjedhja dhe riemërtimi i kolonave, tubacioneve në R
    4.5. Mësimi 5: Shtimi i kolonave të llogaritura në një tabelë në R
    4.6. Mësimi 6: Grupimi dhe grumbullimi i të dhënave në R
    4.7. Mësimi 7: Bashkimi vertikal dhe horizontal i tabelave në R
    4.8. Mësimi 8: Funksionet e dritares në R
    4.9. Mësimi 9: Tabelat rrotulluese ose një analog i tabelave rrotulluese në R
    4.10. Mësimi 10: Ngarkimi i skedarëve JSON në R dhe konvertimi i listave në tabela
    4.11. Mësimi 11: Vizatimi i shpejtë duke përdorur funksionin qplot().
    4.12. Mësimi 12: Hartimi i parcelave shtresë pas shtrese duke përdorur paketën ggplot2
  5. Përfundim

Referencat

Rreth kursit

Kursi është i strukturuar rreth arkitekturës tidyverse, dhe paketat e përfshira në të: readr, vroom, dplyr, tidyr, ggplot2. Sigurisht, ka paketa të tjera të mira në R që kryejnë operacione të ngjashme, për shembull data.table, por sintaksa tidyverse intuitiv, i lehtë për t'u lexuar edhe për një përdorues të patrajnuar, kështu që mendoj se është më mirë të filloni të mësoni gjuhën R me tidyverse.

Kursi do t'ju udhëheqë përmes të gjitha operacioneve të analizës së të dhënave, nga ngarkimi deri te vizualizimi i rezultatit të përfunduar.

Pse R dhe jo Python? Për shkak se R është një gjuhë funksionale, është më e lehtë për përdoruesit e Excel të kalojnë në të, sepse nuk ka nevojë të thellohemi në programimin tradicional të orientuar nga objekti.

Për momentin janë planifikuar 12 video mësime, me kohëzgjatje nga 5 deri në 20 minuta secila.

Mësimet do të hapen gradualisht. Çdo të hënë do të hap akses në një mësim të ri në faqen time të internetit. Kanali në YouTube në një listë të veçantë luajtjeje.

Për kë është ky kurs?

Unë mendoj se kjo është e qartë nga titulli, megjithatë, do ta përshkruaj më në detaje.

Kursi u drejtohet atyre që përdorin në mënyrë aktive Microsoft Excel në punën e tyre dhe zbatojnë të gjithë punën e tyre me të dhëna atje. Në përgjithësi, nëse hapni aplikacionin Microsoft Excel të paktën një herë në javë, atëherë kursi është i përshtatshëm për ju.

Nuk ju kërkohet të keni aftësi programimi për të përfunduar kursin, sepse... Kursi ka për qëllim fillestarët.

Por, ndoshta, duke filluar nga mësimi 4, do të ketë material interesant edhe për përdoruesit aktivë të R, sepse... funksionalitetin kryesor të paketave të tilla si dplyr и tidyr do të diskutohet në disa detaje.

Programi i kursit

Mësimi 1: Instalimi i gjuhës R dhe mjedisit të zhvillimit RStudio

Data e publikimit: Mars 23 2020

referencat:

Video:

Description:
Një mësim hyrës gjatë të cilit do të shkarkojmë dhe instalojmë softuerin e nevojshëm dhe do të shqyrtojmë shkurtimisht aftësitë dhe ndërfaqen e mjedisit të zhvillimit RStudio.

Mësimi 2: Strukturat bazë të të dhënave në R

Data e publikimit: Mars 30 2020

referencat:

Video:

Description:
Ky mësim do t'ju ndihmojë të kuptoni se cilat struktura të dhënash janë të disponueshme në gjuhën R. Ne do të shikojmë në detaje vektorët, kornizat e datave dhe listat. Le të mësojmë se si t'i krijojmë ato dhe të aksesojmë elementët e tyre individualë.

Mësimi 3: Leximi i të dhënave nga skedarët TSV, CSV, Excel dhe Google Sheets

Data e publikimit: Prill 6 2020

referencat:

Video:

Description:
Puna me të dhënat, pavarësisht nga mjeti, fillon me nxjerrjen e tij. Gjatë mësimit përdoren paketat vroom, readxl, googlesheets4 për ngarkimin e të dhënave në mjedisin R nga skedarët csv, tsv, Excel dhe Google Sheets.

Mësimi 4: Filtrimi i rreshtave, përzgjedhja dhe riemërtimi i kolonave, tubacioneve në R

Data e publikimit: Prill 13 2020

referencat:

Video:

Description:
Ky mësim ka të bëjë me paketën dplyr. Në të do të kuptojmë se si të filtrojmë kornizat e të dhënave, të zgjedhim kolonat e nevojshme dhe t'i riemërtojmë ato.

Ne gjithashtu do të mësojmë se çfarë janë tubacionet dhe se si ato ndihmojnë për ta bërë kodin tuaj R më të lexueshëm.

Mësimi 5: Shtimi i kolonave të llogaritura në një tabelë në R

Data e publikimit: Prill 20 2020

referencat:

Video:

Description:
Në këtë video vazhdojmë njohjen tonë me bibliotekën tidyverse dhe paketim dplyr.
Le të shohim familjen e funksioneve mutate(), dhe do të mësojmë se si t'i përdorim ato për të shtuar kolona të reja të llogaritura në tabelë.

Mësimi 6: Grupimi dhe grumbullimi i të dhënave në R

Data e publikimit: Prill 27 2020

referencat:

Video:

Description:
Ky mësim i kushtohet një prej operacioneve kryesore të analizës, grupimit dhe grumbullimit të të dhënave. Gjatë mësimit do të përdorim paketën dplyr dhe funksionet group_by() и summarise().

Ne do të shohim të gjithë familjen e funksioneve summarise(), dmth summarise(), summarise_if() и summarise_at().

Mësimi 7: Bashkimi vertikal dhe horizontal i tabelave në R

Data e publikimit: Maj 4 2020

referencat:

Video:

Description:
Ky mësim do t'ju ndihmojë të kuptoni veprimet e bashkimit vertikal dhe horizontal të tabelave.

Një bashkim vertikal është ekuivalenti i operacionit UNION në gjuhën e pyetjes SQL.

Bashkimi horizontal është më i njohur për përdoruesit e Excel-it falë funksionit VLOOKUP; në SQL, operacione të tilla kryhen nga operatori JOIN.

Gjatë orës së mësimit do të zgjidhim një problem praktik gjatë së cilës do të përdorim paketat dplyr, readxl, tidyr и stringr.

Funksionet kryesore që do të shqyrtojmë:

  • bind_rows() - bashkim vertikal i tabelave
  • left_join() — bashkim horizontal i tabelave
  • semi_join() - duke përfshirë bashkimin e tabelave
  • anti_join() - bashkim ekskluziv i tavolinës

Mësimi 8: Funksionet e dritares në R

Data e publikimit: Maj 11 2020

referencat:

Description:
Funksionet e dritares janë të ngjashme në kuptim me ato grumbulluese; ato gjithashtu marrin një grup vlerash si hyrje dhe kryejnë veprime aritmetike mbi to, por nuk ndryshojnë numrin e rreshtave në rezultatin e daljes.

Në këtë tutorial ne vazhdojmë të studiojmë paketën dplyr, dhe funksionet group_by(), mutate(), si dhe te reja cumsum(), lag(), lead() и arrange().

Mësimi 9: Tabelat rrotulluese ose një analog i tabelave rrotulluese në R

Data e publikimit: Maj 18 2020

referencat:

Description:
Shumica e përdoruesve të Excel përdorin tabela kryesore; ky është një mjet i përshtatshëm me të cilin mund të shndërroni një sërë të dhënash të papërpunuara në raporte të lexueshme në pak sekonda.

Në këtë tutorial do të shikojmë se si të rrotullohen tabelat në R, dhe t'i konvertojmë ato nga formati i gjerë në format të gjatë dhe anasjelltas.

Pjesa më e madhe e mësimit i kushtohet paketës tidyr dhe funksionet pivot_longer() и pivot_wider().

Mësimi 10: Ngarkimi i skedarëve JSON në R dhe konvertimi i listave në tabela

Data e publikimit: Maj 25 2020

referencat:

Description:
JSON dhe XML janë formate jashtëzakonisht të njohura për ruajtjen dhe shkëmbimin e informacionit, zakonisht për shkak të kompaktësisë së tyre.

Por është e vështirë të analizohen të dhënat e paraqitura në formate të tilla, kështu që para analizës është e nevojshme t'i sjellim ato në një formë tabelare, gjë që është pikërisht ajo që do të mësojmë në këtë video.

Mësimi i kushtohet paketës tidyr, të përfshira në thelbin e bibliotekës tidyverse, dhe funksionet unnest_longer(), unnest_wider() и hoist().

Mësimi 11: Vizatimi i shpejtë duke përdorur funksionin qplot().

Data e publikimit: Qershor 1 2020

referencat:

Description:
paketë ggplot2 është një nga mjetet më të njohura të vizualizimit të të dhënave jo vetëm në R.

Në këtë mësim do të mësojmë se si të ndërtojmë grafikë të thjeshtë duke përdorur funksionin qplot(), dhe le të analizojmë të gjitha argumentet e saj.

Mësimi 12: Hartimi i parcelave shtresë pas shtrese duke përdorur paketën ggplot2

Data e publikimit: Qershor 8 2020

referencat:

Description:
Mësimi demonstron fuqinë e plotë të paketës ggplot2 dhe gramatika e ndërtimit të grafikëve në shtresa të ngulitura në të.

Ne do të analizojmë gjeometritë kryesore që janë të pranishme në paketë dhe do të mësojmë se si të aplikojmë shtresa për të ndërtuar një grafik.

Përfundim

Unë u përpoqa t'i qasem sa më koncize formimit të programit të kursit, për të nxjerrë në pah vetëm informacionin më të nevojshëm që do t'ju nevojitet për të ndërmarrë hapat e parë në mësimin e një mjeti kaq të fuqishëm të analizës së të dhënave si gjuha R.

Kursi nuk është një udhëzues shterues për analizën e të dhënave duke përdorur R, por do t'ju ndihmojë të kuptoni të gjitha teknikat e nevojshme për ta bërë këtë.

Ndërsa programi i kursit është hartuar për 12 javë, çdo javë të hënën do të hap akses në mësime të reja, prandaj rekomandoj pajtohem në kanalin YouTube për të mos humbur publikimin e një mësimi të ri.

Burimi: www.habr.com

Shto një koment