ProHoster > blog > Utawala > Lugha ya R kwa watumiaji wa Excel (kozi ya video ya bure)
Lugha ya R kwa watumiaji wa Excel (kozi ya video ya bure)
Kwa sababu ya karantini, wengi sasa hutumia sehemu kubwa ya wakati wao nyumbani, na wakati huu unaweza, na hata unapaswa, kutumika kwa manufaa.
Mwanzoni mwa karantini, niliamua kumaliza baadhi ya miradi ambayo nilianza miezi michache iliyopita. Mojawapo ya miradi hii ilikuwa kozi ya video "Lugha ya R kwa Watumiaji wa Excel". Kwa kozi hii, nilitaka kupunguza kizuizi cha kuingia kwenye R, na kujaza kidogo uhaba uliopo wa vifaa vya mafunzo juu ya mada hii kwa Kirusi.
Ikiwa kazi yote na data katika kampuni unayofanyia kazi bado inafanywa katika Excel, basi napendekeza ujue na kisasa zaidi, na wakati huo huo bure kabisa, chombo cha uchambuzi wa data.
yaliyomo
Ikiwa una nia ya uchambuzi wa data, unaweza kupendezwa na yangu telegram ΠΈ youtube njia. Maudhui mengi yamejitolea kwa lugha ya R.
Kozi hiyo imeundwa karibu na usanifu tidyverse, na vifurushi vilivyojumuishwa ndani yake: readr, vroom, dplyr, tidyr, ggplot2. Bila shaka, kuna vifurushi vingine vyema katika R vinavyofanya shughuli zinazofanana, kwa mfano data.table, lakini sintaksia tidyverse angavu, rahisi kusoma hata kwa mtumiaji ambaye hajafunzwa, kwa hivyo nadhani ni bora kuanza kujifunza lugha ya R na tidyverse.
Kozi itakuongoza kupitia shughuli zote za uchanganuzi wa data, kutoka kwa kupakia hadi kuibua matokeo yaliyokamilika.
Kwa nini R na sio Python? Kwa sababu R ni lugha inayofanya kazi, ni rahisi kwa watumiaji wa Excel kuibadilisha, kwa sababu hakuna haja ya kuzama katika programu ya kitamaduni inayolenga kitu.
Kwa sasa, masomo 12 ya video yamepangwa, hudumu kutoka dakika 5 hadi 20 kila moja.
Masomo yatafunguliwa hatua kwa hatua. Kila Jumatatu nitafungua ufikiaji wa somo jipya kwenye wavuti yangu. Kituo cha YouTube katika orodha tofauti ya kucheza.
Kozi hii ni ya nani?
Nadhani hii ni wazi kutoka kwa kichwa, hata hivyo, nitaelezea kwa undani zaidi.
Kozi hiyo inalenga wale wanaotumia kikamilifu Microsoft Excel katika kazi zao na kutekeleza kazi zao zote na data huko. Kwa ujumla, ikiwa unafungua programu ya Microsoft Excel angalau mara moja kwa wiki, basi kozi hiyo inafaa kwako.
Huhitajiki kuwa na ujuzi wa kupanga programu ili kukamilisha kozi, kwa sababu... Kozi hiyo inalenga kwa Kompyuta.
Lakini, labda, kuanzia somo la 4, kutakuwa na nyenzo za kupendeza kwa watumiaji wa R wanaofanya kazi, pia, kwa sababu ... utendaji kuu wa vifurushi kama vile dplyr ΠΈ tidyr itajadiliwa kwa undani fulani.
Mpango wa kozi
Somo la 1: Kusakinisha lugha ya R na mazingira ya ukuzaji wa RStudio
Maelezo:
Somo la utangulizi ambalo tutapakua na kusakinisha programu muhimu, na kuchunguza kwa ufupi uwezo na kiolesura cha mazingira ya maendeleo ya RStudio.
Maelezo:
Somo hili litakusaidia kuelewa ni miundo gani ya data inayopatikana katika lugha ya R. Tutaangalia kwa undani vekta, fremu za tarehe na orodha. Hebu tujifunze jinsi ya kuziunda na kufikia vipengele vyao binafsi.
Somo la 3: Kusoma data kutoka TSV, CSV, faili za Excel na Majedwali ya Google
Maelezo:
Kufanya kazi na data, bila kujali chombo, huanza na uchimbaji wake. Vifurushi hutumiwa wakati wa somo vroom, readxl, googlesheets4 kwa kupakia data katika mazingira ya R kutoka kwa csv, tsv, faili za Excel na Majedwali ya Google.
Somo la 4: Kuchuja safu, kuchagua na kubadilisha safu wima, mabomba katika R
Maelezo:
Katika video hii tunaendelea kufahamiana na maktaba tidyverse na kifurushi dplyr.
Wacha tuangalie familia ya kazi mutate(), na tutajifunza jinsi ya kuzitumia ili kuongeza safu mpya zilizohesabiwa kwenye meza.
Maelezo:
Somo hili limejitolea kwa mojawapo ya shughuli kuu za uchanganuzi wa data, kuweka vikundi na kujumlisha. Wakati wa somo tutatumia kifurushi dplyr na vipengele group_by() ΠΈ summarise().
Tutaangalia familia nzima ya majukumu summarise(), i.e. summarise(), summarise_if() ΠΈ summarise_at().
Somo la 7: Kuunganisha kwa Wima na Mlalo kwa Jedwali katika R
Maelezo:
Somo hili litakusaidia kuelewa utendakazi wa uunganisho wa wima na mlalo wa jedwali.
Muungano wa wima ni sawa na operesheni ya UNION katika lugha ya kuuliza ya SQL.
Kujiunga kwa mlalo kunajulikana zaidi kwa watumiaji wa Excel kutokana na chaguo la kukokotoa la VLOOKUP; katika SQL, shughuli kama hizo hufanywa na opereta JOIN.
Wakati wa somo tutasuluhisha shida ya vitendo ambayo tutatumia vifurushi dplyr, readxl, tidyr ΠΈ stringr.
Maelezo:
Utendakazi wa dirisha ni sawa kwa maana na zile za kujumlisha; pia huchukua safu ya maadili kama pembejeo na hufanya shughuli za hesabu juu yao, lakini hazibadilishi idadi ya safu katika matokeo ya pato.
Katika somo hili tunaendelea kusoma kifurushi dplyr, na kazi group_by(), mutate(), pamoja na mpya cumsum(), lag(), lead() ΠΈ arrange().
Somo la 9: Majedwali yanayozunguka au analogi ya jedwali egemeo katika R
Maelezo:
Watumiaji wengi wa Excel hutumia majedwali egemeo; hiki ni zana rahisi ambayo unaweza kutumia kugeuza safu ya data ghafi kuwa ripoti zinazoweza kusomeka kwa sekunde chache.
Katika somo hili tutaangalia jinsi ya kuzungusha jedwali katika R, na kuzibadilisha kutoka kwa muundo mpana hadi mrefu na kinyume chake.
Sehemu kubwa ya somo imejitolea kwa kifurushi tidyr na kazi pivot_longer() ΠΈ pivot_wider().
Somo la 10: Kupakia Faili za JSON katika R na Kubadilisha Orodha kuwa Majedwali
Maelezo:
JSON na XML ni miundo maarufu sana ya kuhifadhi na kubadilishana habari, kwa kawaida kutokana na ushikamano wao.
Lakini ni vigumu kuchambua data iliyotolewa katika muundo huo, hivyo kabla ya uchambuzi ni muhimu kuleta katika fomu ya tabular, ambayo ndiyo hasa tutajifunza katika video hii.
Somo limejitolea kwa kifurushi tidyr, iliyojumuishwa katika msingi wa maktaba tidyverse, na kazi unnest_longer(), unnest_wider() ΠΈ hoist().
Somo la 11: Kupanga Njama Haraka Kwa Kutumia Kazi ya qplot()
Maelezo:
Somo linaonyesha nguvu kamili ya kifurushi ggplot2 na sarufi ya kujenga grafu katika tabaka zilizopachikwa ndani yake.
Tutachambua jiometri kuu ambazo zipo kwenye kifurushi na kujifunza jinsi ya kutumia tabaka kuunda grafu.
Hitimisho
Nilijaribu kukaribia uundaji wa programu ya kozi kwa ufupi iwezekanavyo, ili kuonyesha tu habari muhimu zaidi ambayo utahitaji ili kuchukua hatua za kwanza za kujifunza zana yenye nguvu ya uchambuzi wa data kama lugha ya R.
Kozi sio mwongozo kamili wa uchambuzi wa data kwa kutumia lugha ya R, lakini itakusaidia kuelewa mbinu zote muhimu kwa hili.
Ingawa programu ya kozi imeundwa kwa wiki 12, kila wiki Jumatatu nitafungua ufikiaji wa masomo mapya, kwa hivyo ninapendekeza Jiandikishe kwenye chaneli ya YouTube ili usikose uchapishaji wa somo jipya.