R լեզու Excel օգտագործողների համար (անվճար վիդեո դասընթաց)
Կարանտինի պատճառով շատերն այժմ իրենց ժամանակի առյուծի բաժինն անցկացնում են տանը, և այս ժամանակը կարող է և նույնիսկ պետք է օգտակար ծախսվի:
Կարանտինի սկզբում որոշեցի ավարտին հասցնել մի քանի ամիս առաջ սկսած մի քանի նախագծեր։ Այս նախագծերից մեկը «R Language Excel Users-ի համար» տեսադասընթացն էր։ Այս դասընթացով ես ուզում էի իջեցնել R-ի մուտքի արգելքը և մի փոքր լրացնել այս թեմայի վերաբերյալ ռուսերեն լեզվով ուսումնական նյութերի առկա պակասը:
Եթե ձեր աշխատած ընկերությունում տվյալների հետ ամբողջ աշխատանքը դեռ կատարվում է Excel-ում, ապա առաջարկում եմ ծանոթանալ տվյալների վերլուծության ավելի ժամանակակից, և միևնույն ժամանակ լիովին անվճար գործիքին:
Պարունակություն
Եթե դուք հետաքրքրված եք տվյալների վերլուծությամբ, ապա ձեզ կարող է հետաքրքրել իմը հեռագիր и youtube ալիքներ. Բովանդակության մեծ մասը նվիրված է R լեզվին։
Դասընթացը կառուցված է ճարտարապետության շուրջ tidyverse, և դրանում ներառված փաթեթները. readr, vroom, dplyr, tidyr, ggplot2. Իհարկե, R-ում կան այլ լավ փաթեթներ, որոնք նման գործողություններ են կատարում, օրինակ data.table, բայց շարահյուսությունը tidyverse ինտուիտիվ, հեշտ ընթերցվող նույնիսկ չվարժված օգտվողի համար, այնպես որ, կարծում եմ, ավելի լավ է սկսել սովորել R լեզուն tidyverse.
Դասընթացը կուղղորդի ձեզ տվյալների վերլուծության բոլոր գործողությունների ընթացքում՝ բեռնումից մինչև ավարտված արդյունքի պատկերացում:
Ինչու R և ոչ Python: Քանի որ R-ն ֆունկցիոնալ լեզու է, Excel-ի օգտատերերի համար ավելի հեշտ է անցնել դրան, քանի որ կարիք չկա խորանալու ավանդական օբյեկտի վրա հիմնված ծրագրավորման մեջ:
Այս պահին նախատեսված է 12 տեսադաս՝ յուրաքանչյուրը 5-ից 20 րոպե տեւողությամբ։
Դասերը կբացվեն աստիճանաբար։ Ամեն երկուշաբթի ես իմ կայքում կբացեմ նոր դասի հնարավորություն: YouTube ալիք առանձին երգացանկում:
Ո՞ւմ համար է այս դասընթացը:
Կարծում եմ՝ վերնագրից սա պարզ է, այնուամենայնիվ, ավելի մանրամասն կնկարագրեմ։
Դասընթացը նախատեսված է նրանց համար, ովքեր ակտիվորեն օգտագործում են Microsoft Excel-ն իրենց աշխատանքում և այնտեղ իրականացնում են իրենց ամբողջ աշխատանքը տվյալների հետ: Ընդհանուր առմամբ, եթե բացում եք Microsoft Excel հավելվածը առնվազն շաբաթը մեկ անգամ, ապա դասընթացը հարմար է ձեզ համար։
Դասընթացն ավարտելու համար ձեզնից չի պահանջվում ծրագրավորման հմտություններ ունենալ, քանի որ... Դասընթացը նախատեսված է սկսնակների համար։
Բայց, թերևս, 4-րդ դասից սկսած, հետաքրքիր նյութ լինի նաև ակտիվ R օգտատերերի համար, քանի որ... այնպիսի փաթեթների հիմնական ֆունկցիոնալությունը, ինչպիսին է dplyr и tidyr որոշ մանրամասնորեն կքննարկվի:
Դասընթացի ծրագիր
Դաս 1. R լեզվի և RStudio մշակման միջավայրի տեղադրում
Description:
Ներածական դաս, որի ընթացքում մենք կներբեռնենք և կտեղադրենք անհրաժեշտ ծրագրակազմը և համառոտ կուսումնասիրենք RStudio-ի զարգացման միջավայրի հնարավորություններն ու ինտերֆեյսը:
Description:
Այս դասը կօգնի ձեզ հասկանալ, թե տվյալների ինչ կառուցվածքներ կան R լեզվում: Մենք մանրամասն կանդրադառնանք վեկտորներին, ամսաթվերի շրջանակներին և ցուցակներին: Եկեք սովորենք, թե ինչպես ստեղծել դրանք և մուտք գործել դրանց առանձին տարրեր:
Դաս 3. Տվյալների ընթերցում TSV, CSV, Excel ֆայլերից և Google Sheets-ից
Description:
Տվյալների հետ աշխատելը, անկախ գործիքից, սկսվում է դրա արդյունահանումից: Դասի ընթացքում օգտագործվում են փաթեթներ vroom, readxl, googlesheets4 R միջավայրում տվյալների բեռնման համար csv, tsv, Excel ֆայլերից և Google Sheets-ից:
Դաս 4. Տողերի զտում, սյունակների, խողովակաշարերի ընտրություն և վերանվանում Ռ
Description:
Այս դասը փաթեթի մասին է dplyr. Դրանում մենք կպարզենք, թե ինչպես զտել տվյալների շրջանակները, ընտրել անհրաժեշտ սյունակները և վերանվանել դրանք:
Մենք նաև կիմանանք, թե ինչ են խողովակաշարերը և ինչպես են դրանք օգնում ձեր R կոդը ավելի ընթեռնելի դարձնել:
Description:
Այս տեսանյութում շարունակում ենք մեր ծանոթությունը գրադարանի հետ tidyverse և փաթեթ dplyr.
Դիտարկենք գործառույթների ընտանիքը mutate(), և մենք կսովորենք, թե ինչպես դրանք օգտագործել աղյուսակում նոր հաշվարկված սյունակներ ավելացնելու համար:
Description:
Այս դասը նվիրված է տվյալների վերլուծության, խմբավորման և համախմբման հիմնական գործողություններից մեկին: Դասի ընթացքում կօգտագործենք փաթեթը dplyr և առանձնահատկություններ group_by() и summarise().
Մենք կանդրադառնանք գործառույթների ամբողջ ընտանիքին summarise()Այսինքն, summarise(), summarise_if() и summarise_at().
Դաս 7. Սեղանների ուղղահայաց և հորիզոնական միացում Ռ
Description:
Պատուհանների գործառույթները իմաստով նման են ագրեգացիոն գործառույթներին, նրանք նաև որպես մուտք են վերցնում արժեքների զանգված և կատարում թվաբանական գործողություններ դրանց վրա, բայց չեն փոխում ելքային արդյունքի տողերի քանակը:
Այս ձեռնարկում մենք շարունակում ենք ուսումնասիրել փաթեթը dplyrև գործառույթներ group_by(), mutate(), ինչպես նաև նոր cumsum(), lag(), lead() и arrange().
Դաս 9. Պտտվող աղյուսակներ կամ առանցքային աղյուսակների անալոգը Ռ
Description:
Excel-ի օգտատերերի մեծամասնությունը օգտագործում է առանցքային աղյուսակներ, սա հարմար գործիք է, որի միջոցով դուք կարող եք մի քանի վայրկյանում չմշակված տվյալների զանգվածը վերածել ընթեռնելի զեկույցների:
Այս ձեռնարկում մենք կանդրադառնանք, թե ինչպես կարելի է պտտել աղյուսակները R-ով և փոխարկել դրանք լայն ձևաչափից երկար և հակառակը:
Դասի մեծ մասը նվիրված է փաթեթին tidyr և գործառույթներ pivot_longer() и pivot_wider().
Դաս 10. JSON ֆայլերի բեռնում R-ով և ցուցակները աղյուսակների վերածում
Description:
JSON-ը և XML-ը տեղեկատվության պահպանման և փոխանակման չափազանց տարածված ձևաչափեր են, սովորաբար իրենց կոմպակտության պատճառով:
Բայց նման ձևաչափերով ներկայացված տվյալները վերլուծելը դժվար է, ուստի վերլուծությունից առաջ անհրաժեշտ է դրանք բերել աղյուսակային ձևի, ինչը հենց այն է, ինչ մենք կսովորենք այս տեսանյութում:
Դասը նվիրված է փաթեթին tidyr, ընդգրկված գրադարանի առանցքում tidyverseև գործառույթներ unnest_longer(), unnest_wider() и hoist().
Դաս 11. Արագ գծագրում՝ օգտագործելով qplot() ֆունկցիան
Description:
Դասը ցույց է տալիս փաթեթի ամբողջ ուժը ggplot2 և դրա մեջ ներկառուցված շերտերով գրաֆիկների կառուցման քերականությունը:
Մենք կվերլուծենք հիմնական երկրաչափությունները, որոնք առկա են փաթեթում և կսովորենք, թե ինչպես կիրառել շերտեր՝ գրաֆիկ կառուցելու համար:
Ամփոփում
Ես փորձեցի հնարավորինս հակիրճ մոտենալ դասընթացի ծրագրի ձևավորմանը, ընդգծել միայն ամենաանհրաժեշտ տեղեկատվությունը, որը ձեզ անհրաժեշտ կլինի առաջին քայլերն անելու տվյալների վերլուծության այնպիսի հզոր գործիք սովորելու համար, ինչպիսին է R լեզուն:
Դասընթացը R լեզվի օգտագործմամբ տվյալների վերլուծության սպառիչ ուղեցույց չէ, բայց այն կօգնի ձեզ հասկանալ դրա համար անհրաժեշտ բոլոր տեխնիկան:
Թեև դասընթացի ծրագիրը նախատեսված է 12 շաբաթվա համար, ամեն շաբաթ երկուշաբթի ես կբացեմ նոր դասերի հնարավորություն, ուստի խորհուրդ եմ տալիս. բաժանորդագրվել YouTube-ի ալիքում, որպեսզի բաց չթողնեք նոր դասի հրապարակումը։