R լեզու Excel օգտագործողների համար (անվճար վիդեո դասընթաց)

Կարանտինի պատճառով շատերն այժմ իրենց ժամանակի առյուծի բաժինն անցկացնում են տանը, և այս ժամանակը կարող է և նույնիսկ պետք է օգտակար ծախսվի:

Կարանտինի սկզբում որոշեցի ավարտին հասցնել մի քանի ամիս առաջ սկսած մի քանի նախագծեր։ Այս նախագծերից մեկը «R Language Excel Users-ի համար» տեսադասընթացն էր։ Այս դասընթացով ես ուզում էի իջեցնել R-ի մուտքի արգելքը և մի փոքր լրացնել այս թեմայի վերաբերյալ ռուսերեն լեզվով ուսումնական նյութերի առկա պակասը:

Եթե ​​ձեր աշխատած ընկերությունում տվյալների հետ ամբողջ աշխատանքը դեռ կատարվում է Excel-ում, ապա առաջարկում եմ ծանոթանալ տվյալների վերլուծության ավելի ժամանակակից, և միևնույն ժամանակ լիովին անվճար գործիքին:

R լեզու Excel օգտագործողների համար (անվճար վիդեո դասընթաց)

Պարունակություն

Եթե ​​դուք հետաքրքրված եք տվյալների վերլուծությամբ, ապա ձեզ կարող է հետաքրքրել իմը հեռագիր и youtube ալիքներ. Բովանդակության մեծ մասը նվիրված է R լեզվին։

  1. Սայլակ
  2. Դասընթացի մասին
  3. Ո՞ւմ համար է այս դասընթացը:
  4. Դասընթացի ծրագիր
    4.1: Դաս 1. R լեզվի և RStudio մշակման միջավայրի տեղադրում
    4.2: Դաս 2. Տվյալների հիմնական կառուցվածքները Ռ
    4.3: Դաս 3. Տվյալների ընթերցում TSV, CSV, Excel ֆայլերից և Google Sheets-ից
    4.4: Դաս 4. Տողերի զտում, սյունակների, խողովակաշարերի ընտրություն և վերանվանում Ռ
    4.5: Դաս 5. Հաշվարկված սյունակների ավելացում աղյուսակում R-ում
    4.6: Դաս 6. Տվյալների խմբավորում և համախմբում Ռ
    4.7: Դաս 7. Սեղանների ուղղահայաց և հորիզոնական միացում Ռ
    4.8: Դաս 8. Պատուհանի գործառույթները Ռ
    4.9: Դաս 9. Պտտվող աղյուսակներ կամ առանցքային աղյուսակների անալոգը Ռ
    4.10: Դաս 10. JSON ֆայլերի բեռնում R-ով և ցուցակները աղյուսակների վերածում
    4.11: Դաս 11. Արագ գծագրում՝ օգտագործելով qplot() ֆունկցիան
    4.12: Դաս 12. Շերտ առ շերտ գծագրերի գծագրում՝ օգտագործելով ggplot2 փաթեթը
  5. Ամփոփում

Սայլակ

Դասընթացի մասին

Դասընթացը կառուցված է ճարտարապետության շուրջ tidyverse, և դրանում ներառված փաթեթները. readr, vroom, dplyr, tidyr, ggplot2. Իհարկե, R-ում կան այլ լավ փաթեթներ, որոնք նման գործողություններ են կատարում, օրինակ data.table, բայց շարահյուսությունը tidyverse ինտուիտիվ, հեշտ ընթերցվող նույնիսկ չվարժված օգտվողի համար, այնպես որ, կարծում եմ, ավելի լավ է սկսել սովորել R լեզուն tidyverse.

Դասընթացը կուղղորդի ձեզ տվյալների վերլուծության բոլոր գործողությունների ընթացքում՝ բեռնումից մինչև ավարտված արդյունքի պատկերացում:

Ինչու R և ոչ Python: Քանի որ R-ն ֆունկցիոնալ լեզու է, Excel-ի օգտատերերի համար ավելի հեշտ է անցնել դրան, քանի որ կարիք չկա խորանալու ավանդական օբյեկտի վրա հիմնված ծրագրավորման մեջ:

Այս պահին նախատեսված է 12 տեսադաս՝ յուրաքանչյուրը 5-ից 20 րոպե տեւողությամբ։

Դասերը կբացվեն աստիճանաբար։ Ամեն երկուշաբթի ես իմ կայքում կբացեմ նոր դասի հնարավորություն: YouTube ալիք առանձին երգացանկում:

Ո՞ւմ համար է այս դասընթացը:

Կարծում եմ՝ վերնագրից սա պարզ է, այնուամենայնիվ, ավելի մանրամասն կնկարագրեմ։

Դասընթացը նախատեսված է նրանց համար, ովքեր ակտիվորեն օգտագործում են Microsoft Excel-ն իրենց աշխատանքում և այնտեղ իրականացնում են իրենց ամբողջ աշխատանքը տվյալների հետ: Ընդհանուր առմամբ, եթե բացում եք Microsoft Excel հավելվածը առնվազն շաբաթը մեկ անգամ, ապա դասընթացը հարմար է ձեզ համար։

Դասընթացն ավարտելու համար ձեզնից չի պահանջվում ծրագրավորման հմտություններ ունենալ, քանի որ... Դասընթացը նախատեսված է սկսնակների համար։

Բայց, թերևս, 4-րդ դասից սկսած, հետաքրքիր նյութ լինի նաև ակտիվ R օգտատերերի համար, քանի որ... այնպիսի փաթեթների հիմնական ֆունկցիոնալությունը, ինչպիսին է dplyr и tidyr որոշ մանրամասնորեն կքննարկվի:

Դասընթացի ծրագիր

Դաս 1. R լեզվի և RStudio մշակման միջավայրի տեղադրում

Հրապարակման ամսաթիվ. Մարտի 23 2020

Հղումներ.

Video:

Description:
Ներածական դաս, որի ընթացքում մենք կներբեռնենք և կտեղադրենք անհրաժեշտ ծրագրակազմը և համառոտ կուսումնասիրենք RStudio-ի զարգացման միջավայրի հնարավորություններն ու ինտերֆեյսը:

Դաս 2. Տվյալների հիմնական կառուցվածքները Ռ

Հրապարակման ամսաթիվ. Մարտի 30 2020

Հղումներ.

Video:

Description:
Այս դասը կօգնի ձեզ հասկանալ, թե տվյալների ինչ կառուցվածքներ կան R լեզվում: Մենք մանրամասն կանդրադառնանք վեկտորներին, ամսաթվերի շրջանակներին և ցուցակներին: Եկեք սովորենք, թե ինչպես ստեղծել դրանք և մուտք գործել դրանց առանձին տարրեր:

Դաս 3. Տվյալների ընթերցում TSV, CSV, Excel ֆայլերից և Google Sheets-ից

Հրապարակման ամսաթիվ. Ապրիլ 6 2020

Հղումներ.

Video:

Description:
Տվյալների հետ աշխատելը, անկախ գործիքից, սկսվում է դրա արդյունահանումից: Դասի ընթացքում օգտագործվում են փաթեթներ vroom, readxl, googlesheets4 R միջավայրում տվյալների բեռնման համար csv, tsv, Excel ֆայլերից և Google Sheets-ից:

Դաս 4. Տողերի զտում, սյունակների, խողովակաշարերի ընտրություն և վերանվանում Ռ

Հրապարակման ամսաթիվ. Ապրիլ 13 2020

Հղումներ.

Video:

Description:
Այս դասը փաթեթի մասին է dplyr. Դրանում մենք կպարզենք, թե ինչպես զտել տվյալների շրջանակները, ընտրել անհրաժեշտ սյունակները և վերանվանել դրանք:

Մենք նաև կիմանանք, թե ինչ են խողովակաշարերը և ինչպես են դրանք օգնում ձեր R կոդը ավելի ընթեռնելի դարձնել:

Դաս 5. Հաշվարկված սյունակների ավելացում աղյուսակում R-ում

Հրապարակման ամսաթիվ. Ապրիլ 20 2020

Հղումներ.

Video:

Description:
Այս տեսանյութում շարունակում ենք մեր ծանոթությունը գրադարանի հետ tidyverse և փաթեթ dplyr.
Դիտարկենք գործառույթների ընտանիքը mutate(), և մենք կսովորենք, թե ինչպես դրանք օգտագործել աղյուսակում նոր հաշվարկված սյունակներ ավելացնելու համար:

Դաս 6. Տվյալների խմբավորում և համախմբում Ռ

Հրապարակման ամսաթիվ. Ապրիլ 27 2020

Հղումներ.

Video:

Description:
Այս դասը նվիրված է տվյալների վերլուծության, խմբավորման և համախմբման հիմնական գործողություններից մեկին: Դասի ընթացքում կօգտագործենք փաթեթը dplyr և առանձնահատկություններ group_by() и summarise().

Մենք կանդրադառնանք գործառույթների ամբողջ ընտանիքին summarise()Այսինքն, summarise(), summarise_if() и summarise_at().

Դաս 7. Սեղանների ուղղահայաց և հորիզոնական միացում Ռ

Հրապարակման ամսաթիվ. Մայիս 4 2020

Հղումներ.

Video:

Description:
Այս դասը կօգնի ձեզ հասկանալ աղյուսակների ուղղահայաց և հորիզոնական միացման գործողությունները:

Ուղղահայաց միությունը SQL հարցումների լեզվում UNION գործողության համարժեքն է:

Հորիզոնական միացումը Excel-ի օգտատերերին ավելի հայտնի է VLOOKUP ֆունկցիայի շնորհիվ, SQL-ում նման գործողությունները կատարվում են JOIN օպերատորի կողմից:

Դասի ընթացքում կլուծենք գործնական խնդիր, որի ընթացքում կօգտագործենք փաթեթներ dplyr, readxl, tidyr и stringr.

Հիմնական գործառույթները, որոնք մենք կքննարկենք.

  • bind_rows() - սեղանների ուղղահայաց միացում
  • left_join() - սեղանների հորիզոնական միացում
  • semi_join() - ներառյալ սեղանների միացումը
  • anti_join() - բացառիկ սեղանի միացում

Դաս 8. Պատուհանի գործառույթները Ռ

Հրապարակման ամսաթիվ. Մայիս 11 2020

Հղումներ.

Description:
Պատուհանների գործառույթները իմաստով նման են ագրեգացիոն գործառույթներին, նրանք նաև որպես մուտք են վերցնում արժեքների զանգված և կատարում թվաբանական գործողություններ դրանց վրա, բայց չեն փոխում ելքային արդյունքի տողերի քանակը:

Այս ձեռնարկում մենք շարունակում ենք ուսումնասիրել փաթեթը dplyrև գործառույթներ group_by(), mutate(), ինչպես նաև նոր cumsum(), lag(), lead() и arrange().

Դաս 9. Պտտվող աղյուսակներ կամ առանցքային աղյուսակների անալոգը Ռ

Հրապարակման ամսաթիվ. Մայիս 18 2020

Հղումներ.

Description:
Excel-ի օգտատերերի մեծամասնությունը օգտագործում է առանցքային աղյուսակներ, սա հարմար գործիք է, որի միջոցով դուք կարող եք մի քանի վայրկյանում չմշակված տվյալների զանգվածը վերածել ընթեռնելի զեկույցների:

Այս ձեռնարկում մենք կանդրադառնանք, թե ինչպես կարելի է պտտել աղյուսակները R-ով և փոխարկել դրանք լայն ձևաչափից երկար և հակառակը:

Դասի մեծ մասը նվիրված է փաթեթին tidyr և գործառույթներ pivot_longer() и pivot_wider().

Դաս 10. JSON ֆայլերի բեռնում R-ով և ցուցակները աղյուսակների վերածում

Հրապարակման ամսաթիվ. Մայիս 25 2020

Հղումներ.

Description:
JSON-ը և XML-ը տեղեկատվության պահպանման և փոխանակման չափազանց տարածված ձևաչափեր են, սովորաբար իրենց կոմպակտության պատճառով:

Բայց նման ձևաչափերով ներկայացված տվյալները վերլուծելը դժվար է, ուստի վերլուծությունից առաջ անհրաժեշտ է դրանք բերել աղյուսակային ձևի, ինչը հենց այն է, ինչ մենք կսովորենք այս տեսանյութում:

Դասը նվիրված է փաթեթին tidyr, ընդգրկված գրադարանի առանցքում tidyverseև գործառույթներ unnest_longer(), unnest_wider() и hoist().

Դաս 11. Արագ գծագրում՝ օգտագործելով qplot() ֆունկցիան

Հրապարակման ամսաթիվ. Հունիս 1 2020

Հղումներ.

Description:
Փաթեթ ggplot2 տվյալների վիզուալիզացիայի ամենահայտնի գործիքներից է ոչ միայն Ռ.

Այս դասում մենք կսովորենք, թե ինչպես կարելի է կառուցել պարզ գրաֆիկներ՝ օգտագործելով ֆունկցիան qplot(), և եկեք վերլուծենք նրա բոլոր փաստարկները:

Դաս 12. Շերտ առ շերտ գծագրերի գծագրում՝ օգտագործելով ggplot2 փաթեթը

Հրապարակման ամսաթիվ. Հունիս 8 2020

Հղումներ.

Description:
Դասը ցույց է տալիս փաթեթի ամբողջ ուժը ggplot2 և դրա մեջ ներկառուցված շերտերով գրաֆիկների կառուցման քերականությունը:

Մենք կվերլուծենք հիմնական երկրաչափությունները, որոնք առկա են փաթեթում և կսովորենք, թե ինչպես կիրառել շերտեր՝ գրաֆիկ կառուցելու համար:

Ամփոփում

Ես փորձեցի հնարավորինս հակիրճ մոտենալ դասընթացի ծրագրի ձևավորմանը, ընդգծել միայն ամենաանհրաժեշտ տեղեկատվությունը, որը ձեզ անհրաժեշտ կլինի առաջին քայլերն անելու տվյալների վերլուծության այնպիսի հզոր գործիք սովորելու համար, ինչպիսին է R լեզուն:

Դասընթացը R լեզվի օգտագործմամբ տվյալների վերլուծության սպառիչ ուղեցույց չէ, բայց այն կօգնի ձեզ հասկանալ դրա համար անհրաժեշտ բոլոր տեխնիկան:

Թեև դասընթացի ծրագիրը նախատեսված է 12 շաբաթվա համար, ամեն շաբաթ երկուշաբթի ես կբացեմ նոր դասերի հնարավորություն, ուստի խորհուրդ եմ տալիս. բաժանորդագրվել YouTube-ի ալիքում, որպեսզի բաց չթողնեք նոր դասի հրապարակումը։

Source: www.habr.com

Добавить комментарий