R език за потребители на Excel (безплатен видео курс)

Поради карантината мнозина вече прекарват лъвския дял от времето си у дома и това време може и дори трябва да бъде прекарано полезно.

В началото на карантината реших да завърша някои проекти, които започнах преди няколко месеца. Един от тези проекти беше видео курсът „R Language за потребители на Excel“. С този курс исках да намаля бариерата за влизане в R и леко да запълня съществуващия недостиг на обучителни материали по тази тема на руски език.

Ако цялата работа с данни в компанията, в която работите, все още се извършва в Excel, тогава ви предлагам да се запознаете с един по-модерен и в същото време напълно безплатен инструмент за анализ на данни.

R език за потребители на Excel (безплатен видео курс)

Съдържание

Ако се интересувате от анализ на данни, може да се интересувате от моя телеграма и YouTube канали. По-голямата част от съдържанието на който е посветено на езика R.

  1. Позоваването
  2. Относно курса
  3. За кого е този курс?
  4. Програма на курса
    4.1. Урок 1: Инсталиране на езика R и средата за разработка RStudio
    4.2. Урок 2: Основни структури от данни в R
    4.3. Урок 3: Четене на данни от TSV, CSV, Excel файлове и Google Таблици
    4.4. Урок 4: Филтриране на редове, избор и преименуване на колони, конвейери в R
    4.5. Урок 5: Добавяне на изчислени колони към таблица в R
    4.6. Урок 6: Групиране и агрегиране на данни в R
    4.7. Урок 7: Вертикално и хоризонтално свързване на таблици в R
    4.8. Урок 8: Прозоречни функции в R
    4.9. Урок 9: Ротационни таблици или аналог на обобщени таблици в R
    4.10. Урок 10: Зареждане на JSON файлове в R и конвертиране на списъци в таблици
    4.11. Урок 11: Бързо чертане с помощта на функцията qplot().
    4.12. Урок 12: Графика слой по слой с помощта на пакета ggplot2
  5. Заключение

Позоваването

Относно курса

Курсът е структуриран около архитектурата tidyverse, и включените в него пакети: readr, vroom, dplyr, tidyr, ggplot2. Разбира се, има и други добри пакети в R, които извършват подобни операции, например data.table, но синтаксисът tidyverse интуитивен, лесен за четене дори за необучен потребител, така че мисля, че е по-добре да започнете да изучавате езика R с tidyverse.

Курсът ще ви преведе през всички операции за анализ на данни, от зареждане до визуализиране на крайния резултат.

Защо R, а не Python? Тъй като R е функционален език, за потребителите на Excel е по-лесно да преминат към него, защото няма нужда да се задълбочавате в традиционното обектно-ориентирано програмиране.

Към момента са предвидени 12 видео урока с продължителност от 5 до 20 минути всеки.

Уроците ще се отварят постепенно. Всеки понеделник ще отварям достъп до нов урок на моя уебсайт. YouTube канал в отделен плейлист.

За кого е този курс?

Мисля, че това е ясно от заглавието, но ще го опиша по-подробно.

Курсът е насочен към тези, които активно използват Microsoft Excel в работата си и реализират цялата си работа с данни там. Като цяло, ако отваряте приложението Microsoft Excel поне веднъж седмично, тогава курсът е подходящ за вас.

Не е необходимо да имате умения по програмиране, за да завършите курса, защото... Курсът е насочен към начинаещи.

Но може би, започвайки от урок 4, ще има интересен материал и за активните потребители на R, защото... основната функционалност на такива пакети като dplyr и tidyr ще бъдат обсъдени в някои подробности.

Програма на курса

Урок 1: Инсталиране на езика R и средата за разработка RStudio

Дата на издаване: Март 23 2020

за справка:

Video:

Описание:
Въвеждащ урок, по време на който ще изтеглим и инсталираме необходимия софтуер и ще разгледаме накратко възможностите и интерфейса на средата за разработка RStudio.

Урок 2: Основни структури от данни в R

Дата на издаване: Март 30 2020

за справка:

Video:

Описание:
Този урок ще ви помогне да разберете какви структури от данни са налични в езика R. Ще разгледаме подробно вектори, рамки за дати и списъци. Нека научим как да ги създаваме и да имаме достъп до отделните им елементи.

Урок 3: Четене на данни от TSV, CSV, Excel файлове и Google Таблици

Дата на издаване: Април 6 2020

за справка:

Video:

Описание:
Работата с данни, независимо от инструмента, започва с тяхното извличане. Пакетите се използват по време на урока vroom, readxl, googlesheets4 за зареждане на данни в R среда от csv, tsv, Excel файлове и Google Sheets.

Урок 4: Филтриране на редове, избор и преименуване на колони, конвейери в R

Дата на издаване: Април 13 2020

за справка:

Video:

Описание:
Този урок е за пакета dplyr. В него ще разберем как да филтрираме рамки с данни, да избираме необходимите колони и да ги преименуваме.

Ще научим също какво представляват тръбопроводите и как те помагат да направите вашия R код по-четлив.

Урок 5: Добавяне на изчислени колони към таблица в R

Дата на издаване: Април 20 2020

за справка:

Video:

Описание:
В това видео продължаваме запознанството си с библиотеката tidyverse и пакет dplyr.
Нека да разгледаме семейството от функции mutate()и ще научим как да ги използваме, за да добавяме нови изчисляеми колони към таблицата.

Урок 6: Групиране и агрегиране на данни в R

Дата на издаване: Април 27 2020

за справка:

Video:

Описание:
Този урок е посветен на една от основните операции за анализ, групиране и агрегиране на данни. По време на урока ще използваме пакета dplyr функционирам group_by() и summarise().

Ще разгледаме цялото семейство от функции summarise(), това е summarise(), summarise_if() и summarise_at().

Урок 7: Вертикално и хоризонтално свързване на таблици в R

Дата на издаване: May 4 2020

за справка:

Video:

Описание:
Този урок ще ви помогне да разберете операциите по вертикално и хоризонтално свързване на таблици.

Вертикалното обединение е еквивалентът на операцията UNION в езика за заявки SQL.

Хоризонталното свързване е по-известно на потребителите на Excel благодарение на функцията VLOOKUP; в SQL такива операции се извършват от оператора JOIN.

По време на урока ще решим практическа задача, по време на която ще използваме пакети dplyr, readxl, tidyr и stringr.

Основните функции, които ще разгледаме:

  • bind_rows() - вертикално свързване на таблици
  • left_join() — хоризонтално свързване на таблици
  • semi_join() - включително съединяване на таблици
  • anti_join() - изключително присъединяване към маса

Урок 8: Прозоречни функции в R

Дата на издаване: May 11 2020

за справка:

Описание:
Функциите на прозореца са подобни по значение на тези за агрегиране; те също приемат масив от стойности като вход и извършват аритметични операции върху тях, но не променят броя на редовете в изходния резултат.

В този урок ние продължаваме да изучаваме пакета dplyr, и функции group_by(), mutate(), както и нови cumsum(), lag(), lead() и arrange().

Урок 9: Ротационни таблици или аналог на обобщени таблици в R

Дата на издаване: May 18 2020

за справка:

Описание:
Повечето потребители на Excel използват осеви таблици; това е удобен инструмент, с който можете да превърнете масив от необработени данни в отчети за четене за секунди.

В този урок ще разгледаме как да завъртаме таблици в R и да ги конвертираме от широк в дълъг формат и обратно.

По-голямата част от урока е посветена на опаковката tidyr и функции pivot_longer() и pivot_wider().

Урок 10: Зареждане на JSON файлове в R и конвертиране на списъци в таблици

Дата на издаване: May 25 2020

за справка:

Описание:
JSON и XML са изключително популярни формати за съхранение и обмен на информация, обикновено поради своята компактност.

Но е трудно да се анализират данни, представени в такива формати, така че преди анализ е необходимо да ги приведете в таблична форма, което е точно това, което ще научим в това видео.

Урокът е посветен на опаковката tidyr, включени в ядрото на библиотеката tidyverse, и функции unnest_longer(), unnest_wider() и hoist().

Урок 11: Бързо чертане с помощта на функцията qplot().

Дата на издаване: Юни 1 2020

за справка:

Описание:
пакет ggplot2 е един от най-популярните инструменти за визуализация на данни не само в R.

В този урок ще научим как да изграждаме прости графики с помощта на функцията qplot(), и нека анализираме всичките й аргументи.

Урок 12: Графика слой по слой с помощта на пакета ggplot2

Дата на издаване: Юни 8 2020

за справка:

Описание:
Урокът демонстрира пълната мощ на пакета ggplot2 и граматиката на изграждане на графики в слоеве, вградени в него.

Ще анализираме основните геометрии, които присъстват в пакета, и ще научим как да прилагаме слоеве за изграждане на графика.

Заключение

Опитах се да подходя към формирането на програмата на курса възможно най-кратко, за да подчертая само най-необходимата информация, която ще ви е необходима, за да направите първите стъпки в изучаването на такъв мощен инструмент за анализ на данни като езика R.

Курсът не е изчерпателно ръководство за анализ на данни с помощта на R, но ще ви помогне да разберете всички необходими техники за това.

Докато програмата на курса е предназначена за 12 седмици, всяка седмица в понеделник ще отварям достъп до нови уроци, така че препоръчвам Абонирай се в канала на YouTube, за да не пропуснете публикуването на нов урок.

Източник: www.habr.com

Добавяне на нов коментар