Excel erabiltzaileentzako R hizkuntza (doako bideo ikastaroa)

Berrogeialdia dela eta, askok orain etxean pasatzen dute denboraren zatirik handiena, eta denbora hau erabilgarria izan daiteke, eta baita behar luke.

Berrogeialdiaren hasieran, duela hilabete batzuk hasitako proiektu batzuk amaitzea erabaki nuen. Proiektu horietako bat β€œR Language for Excel Users” bideo ikastaroa izan zen. Ikastaro honekin, R-n sartzeko oztopoa jaitsi nahi nuen, eta errusieraz gai honi buruzko prestakuntza-materialen eskasia apur bat bete.

Lan egiten duzun enpresan datuekin lan guztia Excel-en egiten bada oraindik, orduan datuen analisirako tresna modernoago eta, aldi berean, guztiz doako bat ezagutzea gomendatzen dizut.

Excel erabiltzaileentzako R hizkuntza (doako bideo ikastaroa)

Edukia

Datuen analisia interesatzen bazaizu, baliteke nirea interesatzea telegrama ΠΈ youtube kanalak. Eduki gehienak R hizkuntzari eskainitakoak dira.

  1. Erreferentziak
  2. Ikastaroari buruz
  3. Norentzat da ikastaro hau?
  4. Ikastaroen programa
    4.1. 1. ikasgaia: R lengoaia eta RStudio garapen ingurunea instalatzea
    4.2. 2. ikasgaia: oinarrizko datuen egiturak R-n
    4.3. 3. ikasgaia: TSV, CSV, Excel fitxategi eta Google Sheets-en datuak irakurtzea
    4.4. 4. ikasgaia: errenkadak iragaztea, zutabeak hautatu eta izena aldatzea, kanalizazioak R-n
    4.5. 5. ikasgaia: R-ko taula bati kalkulatutako zutabeak gehitzea
    4.6. 6. ikasgaia: datuak taldekatzea eta batutzea R-n
    4.7. 7. ikasgaia: Taulen elkarketa bertikala eta horizontala R-n
    4.8. 8. ikasgaia: leihoen funtzioak R-n
    4.9. 9. ikasgaia: taula birakariak edo taula dinamikoen analogo bat R-n
    4.10. 10. ikasgaia: JSON fitxategiak R-n kargatzea eta zerrendak tauletan bihurtzea
    4.11. 11. Ikasgaia: Azkar irudikatzea qplot() Funtzioa erabiliz
    4.12. 12. ikasgaia: geruzaz geruza grafikoak marraztea ggplot2 paketea erabiliz
  5. Ondorioa

Erreferentziak

Ikastaroari buruz

Ikastaroa arkitekturaren inguruan egituratzen da tidyverse, eta bertan sartzen diren paketeak: readr, vroom, dplyr, tidyr, ggplot2. Noski, R-n badaude antzeko eragiketak egiten dituzten beste pakete on batzuk, adibidez data.table, baina sintaxia tidyverse intuitiboa, irakurtzeko erraza baita trebatu gabeko erabiltzailearentzat ere, beraz, hobe dela uste dut R hizkuntza ikasten hastea. tidyverse.

Ikastaroak datuak aztertzeko eragiketa guztietan gidatuko zaitu, kargatzetik amaitutako emaitza bistaratu arte.

Zergatik R eta ez Python? R hizkuntza funtzionala denez, errazagoa da Excel-eko erabiltzaileentzat horretara aldatzea, zeren ez da objektuetara zuzendutako programazio tradizionalean sakondu beharrik.

Momentuz, 12 bideo ikasgai daude aurreikusita, bakoitza 5 eta 20 minutu arteko iraupena dutenak.

Ikastaroak pixkanaka irekiko dira. Astelehenero ikasgai berri baterako sarbidea irekiko dut nire webgunean. YouTube kanala erreprodukzio zerrenda bereizi batean.

Norentzat da ikastaro hau?

Nik uste dut izenburutik argi dagoela, hala ere, zehatzago deskribatuko dut.

Ikastaroa beren lanean Microsoft Excel aktiboki erabiltzen dutenei zuzenduta dago eta bertan datuekin egiten duten lan guztia inplementatzen dutenei. Oro har, astean behin gutxienez Microsoft Excel aplikazioa irekitzen baduzu, ikastaroa egokia da zuretzat.

Ez duzu programazio trebetasunik eduki behar ikastaroa burutzeko, izan ere... Ikastaroa hasiberriei zuzenduta dago.

Baina, agian, 4. ikasgaitik hasita, R erabiltzaile aktiboentzat ere material interesgarria egongo da, zeren... gisako paketeen funtzionalitate nagusia dplyr ΠΈ tidyr zehatz-mehatz eztabaidatuko da.

Ikastaroen programa

1. ikasgaia: R lengoaia eta RStudio garapen ingurunea instalatzea

Argitalpen data: Martxoaren 23 2020

erreferentziak:

Video:

Description:
Sarrerako ikasgai bat, eta bertan beharrezko softwarea deskargatu eta instalatuko dugu, eta laburki aztertuko ditugu RStudio garapen-ingurunearen gaitasunak eta interfazea.

2. ikasgaia: oinarrizko datuen egiturak R-n

Argitalpen data: Martxoaren 30 2020

erreferentziak:

Video:

Description:
Ikasgai honek R hizkuntzan zein datu-egitura dauden ulertzen lagunduko dizu. Bektoreak, data-markoak eta zerrendak zehatz-mehatz aztertuko ditugu. Ikas dezagun nola sortu eta haien elementu indibidualak atzitu.

3. ikasgaia: TSV, CSV, Excel fitxategi eta Google Sheets-en datuak irakurtzea

Argitalpen data: Apirilaren 6 2020

erreferentziak:

Video:

Description:
Datuekin lan egitea, tresna edozein dela ere, bere erauzketatik hasten da. Ikasgaian zehar paketeak erabiltzen dira vroom, readxl, googlesheets4 csv, tsv, Excel fitxategietatik eta Google Sheets-etatik datuak R ingurunean kargatzeko.

4. ikasgaia: errenkadak iragaztea, zutabeak hautatu eta izena aldatzea, kanalizazioak R-n

Argitalpen data: Apirilaren 13 2020

erreferentziak:

Video:

Description:
Ikasgai hau paketeari buruzkoa da dplyr. Bertan datu-markoak nola iragazi, beharrezko zutabeak hautatu eta izena aldatu egingo dugu.

Gainera, kanalizazioak zer diren eta nola laguntzen duten zure R kodea irakurgarriagoa izan dadin ikasiko dugu.

5. ikasgaia: R-ko taula bati kalkulatutako zutabeak gehitzea

Argitalpen data: Apirilaren 20 2020

erreferentziak:

Video:

Description:
Bideo honetan liburutegia ezagutzen jarraitzen dugu tidyverse eta paketea dplyr.
Ikus dezagun funtzioen familia mutate(), eta taulari kalkulatutako zutabe berriak gehitzeko erabiltzen ikasiko dugu.

6. ikasgaia: datuak taldekatzea eta batutzea R-n

Argitalpen data: Apirilaren 27 2020

erreferentziak:

Video:

Description:
Ikasgai hau datuak aztertzeko, taldekatzeko eta agregatzeko eragiketa nagusietako bati eskainita dago. Ikasgaian zehar paketea erabiliko dugu dplyr eta ezaugarriak group_by() ΠΈ summarise().

Funtzio-familia osoa aztertuko dugu summarise(), hau da. summarise(), summarise_if() ΠΈ summarise_at().

7. ikasgaia: Taulen elkarketa bertikala eta horizontala R-n

Argitalpen data: Maiatzaren 4 2020

erreferentziak:

Video:

Description:
Ikasgai honek taulak bertikala eta horizontala elkartzeko eragiketak ulertzen lagunduko dizu.

Batasun bertikala SQL kontsulta-lengoaian UNION eragiketaren baliokidea da.

Batuketa horizontala hobeto ezagutzen dute Excel erabiltzaileek VLOOKUP funtzioari esker; SQL-n, eragiketak JOIN operadoreak egiten ditu.

Ikasgaian zehar arazo praktiko bat ebatziko dugu eta bertan paketeak erabiliko ditugu dplyr, readxl, tidyr ΠΈ stringr.

Kontuan hartuko ditugun funtzio nagusiak:

  • bind_rows() - Taulen elkarketa bertikala
  • left_join() β€” Taulen elkarketa horizontala
  • semi_join() - batzeko mahaiak barne
  • anti_join() - mahaiaren batzea esklusiboa

8. ikasgaia: leihoen funtzioak R-n

Argitalpen data: Maiatzaren 11 2020

erreferentziak:

Description:
Leiho-funtzioak agregazioen esanahiaren antzekoak dira; balio-matrize bat ere hartzen dute sarrera gisa eta eragiketa aritmetikoak egiten dituzte, baina ez dute irteerako emaitzako errenkada kopurua aldatzen.

Tutorial honetan paketea aztertzen jarraitzen dugu dplyr, eta funtzioak group_by(), mutate(), baita berria ere cumsum(), lag(), lead() ΠΈ arrange().

9. ikasgaia: taula birakariak edo taula dinamikoen analogo bat R-n

Argitalpen data: Maiatzaren 18 2020

erreferentziak:

Description:
Excel-eko erabiltzaile gehienek taula dinamikoak erabiltzen dituzte; tresna erosoa da, eta datu gordinak txosten irakurgarri bihur ditzakezu segundo gutxitan.

Tutorial honetan taulak R-n biratu, eta formatu zabaletik luzera eta alderantziz nola bihurtu ikusiko dugu.

Ikasgaiaren zatirik handiena paketeari eskaintzen zaio tidyr eta funtzioak pivot_longer() ΠΈ pivot_wider().

10. ikasgaia: JSON fitxategiak R-n kargatzea eta zerrendak tauletan bihurtzea

Argitalpen data: Maiatzaren 25 2020

erreferentziak:

Description:
JSON eta XML formatu oso ezagunak dira informazioa gordetzeko eta trukatzeko, normalean trinkotasunagatik.

Baina zaila da horrelako formatuetan aurkezten diren datuak aztertzea, beraz, aztertu baino lehen, beharrezkoa da taula formatuan ekartzea, eta horixe da bideo honetan ikasiko duguna.

Ikasgaia paketeari eskainita dago tidyr, liburutegiaren muinean sartuta tidyverse, eta funtzioak unnest_longer(), unnest_wider() ΠΈ hoist().

11. Ikasgaia: Azkar irudikatzea qplot() Funtzioa erabiliz

Argitalpen data: Ekainaren 1 2020

erreferentziak:

Description:
pakete ggplot2 R-n ez ezik, datuak bistaratzeko tresnarik ezagunenetako bat da.

Ikasgai honetan funtzioa erabiliz grafiko errazak eraikitzen ikasiko dugu qplot(), eta azter ditzagun bere argudio guztiak.

12. ikasgaia: geruzaz geruza grafikoak marraztea ggplot2 paketea erabiliz

Argitalpen data: Ekainaren 8 2020

erreferentziak:

Description:
Ikasgaiak paketearen botere osoa erakusten du ggplot2 eta bertan txertatutako geruzetan grafikoak eraikitzeko gramatika.

Paketean dauden geometria nagusiak aztertuko ditugu eta grafiko bat eraikitzeko geruzak nola aplikatu ikasiko dugu.

Ondorioa

Ikastaroaren programaren eraketa ahalik eta zehatzen jorratzen saiatu naiz, R hizkuntza bezalako datu-analisi tresna indartsua ikasteko lehen urratsak emateko beharko duzun informaziorik beharrezkoena soilik nabarmentzen.

Ikastaroa ez da R hizkuntza erabiliz datuak aztertzeko gida zehatza, baina horretarako beharrezkoak diren teknika guztiak ulertzen lagunduko dizu.

Ikastaroaren programa 12 asterako diseinatuta dagoen arren, astelehenetan astero irekiko dut ikasgai berrietarako sarbidea, beraz gomendatzen dut harpide YouTube kanalean, ikasgai berri baten argitalpena ez galtzeko.

Iturria: www.habr.com

Gehitu iruzkin berria