Lugha ya R kwa watumiaji wa Excel (kozi ya video ya bure)

Kwa sababu ya karantini, wengi sasa hutumia sehemu kubwa ya wakati wao nyumbani, na wakati huu unaweza, na hata unapaswa, kutumika kwa manufaa.

Mwanzoni mwa karantini, niliamua kumaliza baadhi ya miradi ambayo nilianza miezi michache iliyopita. Mojawapo ya miradi hii ilikuwa kozi ya video "Lugha ya R kwa Watumiaji wa Excel". Kwa kozi hii, nilitaka kupunguza kizuizi cha kuingia kwenye R, na kujaza kidogo uhaba uliopo wa vifaa vya mafunzo juu ya mada hii kwa Kirusi.

Ikiwa kazi yote na data katika kampuni unayofanyia kazi bado inafanywa katika Excel, basi napendekeza ujue na kisasa zaidi, na wakati huo huo bure kabisa, chombo cha uchambuzi wa data.

Lugha ya R kwa watumiaji wa Excel (kozi ya video ya bure)

yaliyomo

Ikiwa una nia ya uchambuzi wa data, unaweza kupendezwa na yangu telegram ΠΈ youtube njia. Maudhui mengi yamejitolea kwa lugha ya R.

  1. marejeo
  2. Kuhusu kozi
  3. Kozi hii ni ya nani?
  4. Mpango wa kozi
    4.1. Somo la 1: Kusakinisha lugha ya R na mazingira ya ukuzaji wa RStudio
    4.2. Somo la 2: Miundo Msingi ya Data katika R
    4.3. Somo la 3: Kusoma data kutoka TSV, CSV, faili za Excel na Majedwali ya Google
    4.4. Somo la 4: Kuchuja safu, kuchagua na kubadilisha safu wima, mabomba katika R
    4.5. Somo la 5: Kuongeza Safu Wima Zilizokokotolewa kwenye Jedwali katika R
    4.6. Somo la 6: Kupanga na Kukusanya Data katika R
    4.7. Somo la 7: Kuunganisha kwa Wima na Mlalo kwa Jedwali katika R
    4.8. Somo la 8: Kazi za Dirisha katika R
    4.9. Somo la 9: Majedwali yanayozunguka au analogi ya jedwali egemeo katika R
    4.10. Somo la 10: Kupakia Faili za JSON katika R na Kubadilisha Orodha kuwa Majedwali
    4.11. Somo la 11: Kupanga Njama Haraka Kwa Kutumia Kazi ya qplot()
    4.12. Somo la 12: Kupanga safu kwa viwanja vya safu kwa kutumia kifurushi cha ggplot2
  5. Hitimisho

marejeo

Kuhusu kozi

Kozi hiyo imeundwa karibu na usanifu tidyverse, na vifurushi vilivyojumuishwa ndani yake: readr, vroom, dplyr, tidyr, ggplot2. Bila shaka, kuna vifurushi vingine vyema katika R vinavyofanya shughuli zinazofanana, kwa mfano data.table, lakini sintaksia tidyverse angavu, rahisi kusoma hata kwa mtumiaji ambaye hajafunzwa, kwa hivyo nadhani ni bora kuanza kujifunza lugha ya R na tidyverse.

Kozi itakuongoza kupitia shughuli zote za uchanganuzi wa data, kutoka kwa kupakia hadi kuibua matokeo yaliyokamilika.

Kwa nini R na sio Python? Kwa sababu R ni lugha inayofanya kazi, ni rahisi kwa watumiaji wa Excel kuibadilisha, kwa sababu hakuna haja ya kuzama katika programu ya kitamaduni inayolenga kitu.

Kwa sasa, masomo 12 ya video yamepangwa, hudumu kutoka dakika 5 hadi 20 kila moja.

Masomo yatafunguliwa hatua kwa hatua. Kila Jumatatu nitafungua ufikiaji wa somo jipya kwenye wavuti yangu. Kituo cha YouTube katika orodha tofauti ya kucheza.

Kozi hii ni ya nani?

Nadhani hii ni wazi kutoka kwa kichwa, hata hivyo, nitaelezea kwa undani zaidi.

Kozi hiyo inalenga wale wanaotumia kikamilifu Microsoft Excel katika kazi zao na kutekeleza kazi zao zote na data huko. Kwa ujumla, ikiwa unafungua programu ya Microsoft Excel angalau mara moja kwa wiki, basi kozi hiyo inafaa kwako.

Huhitajiki kuwa na ujuzi wa kupanga programu ili kukamilisha kozi, kwa sababu... Kozi hiyo inalenga kwa Kompyuta.

Lakini, labda, kuanzia somo la 4, kutakuwa na nyenzo za kupendeza kwa watumiaji wa R wanaofanya kazi, pia, kwa sababu ... utendaji kuu wa vifurushi kama vile dplyr ΠΈ tidyr itajadiliwa kwa undani fulani.

Mpango wa kozi

Somo la 1: Kusakinisha lugha ya R na mazingira ya ukuzaji wa RStudio

Tarehe ya kuchapishwa: Machi 23 2020

Marejeo:

Video:

Maelezo:
Somo la utangulizi ambalo tutapakua na kusakinisha programu muhimu, na kuchunguza kwa ufupi uwezo na kiolesura cha mazingira ya maendeleo ya RStudio.

Somo la 2: Miundo Msingi ya Data katika R

Tarehe ya kuchapishwa: Machi 30 2020

Marejeo:

Video:

Maelezo:
Somo hili litakusaidia kuelewa ni miundo gani ya data inayopatikana katika lugha ya R. Tutaangalia kwa undani vekta, fremu za tarehe na orodha. Hebu tujifunze jinsi ya kuziunda na kufikia vipengele vyao binafsi.

Somo la 3: Kusoma data kutoka TSV, CSV, faili za Excel na Majedwali ya Google

Tarehe ya kuchapishwa: Aprili 6 2020

Marejeo:

Video:

Maelezo:
Kufanya kazi na data, bila kujali chombo, huanza na uchimbaji wake. Vifurushi hutumiwa wakati wa somo vroom, readxl, googlesheets4 kwa kupakia data katika mazingira ya R kutoka kwa csv, tsv, faili za Excel na Majedwali ya Google.

Somo la 4: Kuchuja safu, kuchagua na kubadilisha safu wima, mabomba katika R

Tarehe ya kuchapishwa: Aprili 13 2020

Marejeo:

Video:

Maelezo:
Somo hili linahusu kifurushi dplyr. Ndani yake tutajua jinsi ya kuchuja dataframes, chagua safu wima zinazohitajika na uzipe jina jipya.

Pia tutajifunza mabomba ni nini na jinsi yanavyosaidia kufanya msimbo wako wa R usomeke zaidi.

Somo la 5: Kuongeza Safu Wima Zilizokokotolewa kwenye Jedwali katika R

Tarehe ya kuchapishwa: Aprili 20 2020

Marejeo:

Video:

Maelezo:
Katika video hii tunaendelea kufahamiana na maktaba tidyverse na kifurushi dplyr.
Wacha tuangalie familia ya kazi mutate(), na tutajifunza jinsi ya kuzitumia ili kuongeza safu mpya zilizohesabiwa kwenye meza.

Somo la 6: Kupanga na Kukusanya Data katika R

Tarehe ya kuchapishwa: Aprili 27 2020

Marejeo:

Video:

Maelezo:
Somo hili limejitolea kwa mojawapo ya shughuli kuu za uchanganuzi wa data, kuweka vikundi na kujumlisha. Wakati wa somo tutatumia kifurushi dplyr na vipengele group_by() ΠΈ summarise().

Tutaangalia familia nzima ya majukumu summarise(), i.e. summarise(), summarise_if() ΠΈ summarise_at().

Somo la 7: Kuunganisha kwa Wima na Mlalo kwa Jedwali katika R

Tarehe ya kuchapishwa: Mei 4 2020

Marejeo:

Video:

Maelezo:
Somo hili litakusaidia kuelewa utendakazi wa uunganisho wa wima na mlalo wa jedwali.

Muungano wa wima ni sawa na operesheni ya UNION katika lugha ya kuuliza ya SQL.

Kujiunga kwa mlalo kunajulikana zaidi kwa watumiaji wa Excel kutokana na chaguo la kukokotoa la VLOOKUP; katika SQL, shughuli kama hizo hufanywa na opereta JOIN.

Wakati wa somo tutasuluhisha shida ya vitendo ambayo tutatumia vifurushi dplyr, readxl, tidyr ΠΈ stringr.

Kazi kuu ambazo tutazingatia:

  • bind_rows() - uunganisho wa wima wa meza
  • left_join() - Uunganisho wa usawa wa meza
  • semi_join() - ikiwa ni pamoja na kuunganisha meza
  • anti_join() - Jedwali la kipekee la kujiunga

Somo la 8: Kazi za Dirisha katika R

Tarehe ya kuchapishwa: Mei 11 2020

Marejeo:

Maelezo:
Utendakazi wa dirisha ni sawa kwa maana na zile za kujumlisha; pia huchukua safu ya maadili kama pembejeo na hufanya shughuli za hesabu juu yao, lakini hazibadilishi idadi ya safu katika matokeo ya pato.

Katika somo hili tunaendelea kusoma kifurushi dplyr, na kazi group_by(), mutate(), pamoja na mpya cumsum(), lag(), lead() ΠΈ arrange().

Somo la 9: Majedwali yanayozunguka au analogi ya jedwali egemeo katika R

Tarehe ya kuchapishwa: Mei 18 2020

Marejeo:

Maelezo:
Watumiaji wengi wa Excel hutumia majedwali egemeo; hiki ni zana rahisi ambayo unaweza kutumia kugeuza safu ya data ghafi kuwa ripoti zinazoweza kusomeka kwa sekunde chache.

Katika somo hili tutaangalia jinsi ya kuzungusha jedwali katika R, na kuzibadilisha kutoka kwa muundo mpana hadi mrefu na kinyume chake.

Sehemu kubwa ya somo imejitolea kwa kifurushi tidyr na kazi pivot_longer() ΠΈ pivot_wider().

Somo la 10: Kupakia Faili za JSON katika R na Kubadilisha Orodha kuwa Majedwali

Tarehe ya kuchapishwa: Mei 25 2020

Marejeo:

Maelezo:
JSON na XML ni miundo maarufu sana ya kuhifadhi na kubadilishana habari, kwa kawaida kutokana na ushikamano wao.

Lakini ni vigumu kuchambua data iliyotolewa katika muundo huo, hivyo kabla ya uchambuzi ni muhimu kuleta katika fomu ya tabular, ambayo ndiyo hasa tutajifunza katika video hii.

Somo limejitolea kwa kifurushi tidyr, iliyojumuishwa katika msingi wa maktaba tidyverse, na kazi unnest_longer(), unnest_wider() ΠΈ hoist().

Somo la 11: Kupanga Njama Haraka Kwa Kutumia Kazi ya qplot()

Tarehe ya kuchapishwa: Juni 1 2020

Marejeo:

Maelezo:
Ufungaji ggplot2 ni mojawapo ya zana maarufu za taswira ya data sio tu katika R.

Katika somo hili tutajifunza jinsi ya kuunda grafu rahisi kwa kutumia kazi qplot(), na tuchambue hoja zake zote.

Somo la 12: Kupanga safu kwa viwanja vya safu kwa kutumia kifurushi cha ggplot2

Tarehe ya kuchapishwa: Juni 8 2020

Marejeo:

Maelezo:
Somo linaonyesha nguvu kamili ya kifurushi ggplot2 na sarufi ya kujenga grafu katika tabaka zilizopachikwa ndani yake.

Tutachambua jiometri kuu ambazo zipo kwenye kifurushi na kujifunza jinsi ya kutumia tabaka kuunda grafu.

Hitimisho

Nilijaribu kukaribia uundaji wa programu ya kozi kwa ufupi iwezekanavyo, ili kuonyesha tu habari muhimu zaidi ambayo utahitaji ili kuchukua hatua za kwanza za kujifunza zana yenye nguvu ya uchambuzi wa data kama lugha ya R.

Kozi sio mwongozo kamili wa uchambuzi wa data kwa kutumia lugha ya R, lakini itakusaidia kuelewa mbinu zote muhimu kwa hili.

Ingawa programu ya kozi imeundwa kwa wiki 12, kila wiki Jumatatu nitafungua ufikiaji wa masomo mapya, kwa hivyo ninapendekeza Jiandikishe kwenye chaneli ya YouTube ili usikose uchapishaji wa somo jipya.

Chanzo: mapenzi.com

Kuongeza maoni