R език за потребители на Excel (безплатен видео курс)
Поради карантината мнозина вече прекарват лъвския дял от времето си у дома и това време може и дори трябва да бъде прекарано полезно.
В началото на карантината реших да завърша някои проекти, които започнах преди няколко месеца. Един от тези проекти беше видео курсът „R Language за потребители на Excel“. С този курс исках да намаля бариерата за влизане в R и леко да запълня съществуващия недостиг на обучителни материали по тази тема на руски език.
Ако цялата работа с данни в компанията, в която работите, все още се извършва в Excel, тогава ви предлагам да се запознаете с един по-модерен и в същото време напълно безплатен инструмент за анализ на данни.
Съдържание
Ако се интересувате от анализ на данни, може да се интересувате от моя телеграма и YouTube канали. По-голямата част от съдържанието на който е посветено на езика R.
Курсът е структуриран около архитектурата tidyverse, и включените в него пакети: readr, vroom, dplyr, tidyr, ggplot2. Разбира се, има и други добри пакети в R, които извършват подобни операции, например data.table, но синтаксисът tidyverse интуитивен, лесен за четене дори за необучен потребител, така че мисля, че е по-добре да започнете да изучавате езика R с tidyverse.
Курсът ще ви преведе през всички операции за анализ на данни, от зареждане до визуализиране на крайния резултат.
Защо R, а не Python? Тъй като R е функционален език, за потребителите на Excel е по-лесно да преминат към него, защото няма нужда да се задълбочавате в традиционното обектно-ориентирано програмиране.
Към момента са предвидени 12 видео урока с продължителност от 5 до 20 минути всеки.
Уроците ще се отварят постепенно. Всеки понеделник ще отварям достъп до нов урок на моя уебсайт. YouTube канал в отделен плейлист.
За кого е този курс?
Мисля, че това е ясно от заглавието, но ще го опиша по-подробно.
Курсът е насочен към тези, които активно използват Microsoft Excel в работата си и реализират цялата си работа с данни там. Като цяло, ако отваряте приложението Microsoft Excel поне веднъж седмично, тогава курсът е подходящ за вас.
Не е необходимо да имате умения по програмиране, за да завършите курса, защото... Курсът е насочен към начинаещи.
Но може би, започвайки от урок 4, ще има интересен материал и за активните потребители на R, защото... основната функционалност на такива пакети като dplyr и tidyr ще бъдат обсъдени в някои подробности.
Програма на курса
Урок 1: Инсталиране на езика R и средата за разработка RStudio
Описание:
Въвеждащ урок, по време на който ще изтеглим и инсталираме необходимия софтуер и ще разгледаме накратко възможностите и интерфейса на средата за разработка RStudio.
Описание:
Този урок ще ви помогне да разберете какви структури от данни са налични в езика R. Ще разгледаме подробно вектори, рамки за дати и списъци. Нека научим как да ги създаваме и да имаме достъп до отделните им елементи.
Урок 3: Четене на данни от TSV, CSV, Excel файлове и Google Таблици
Описание:
Работата с данни, независимо от инструмента, започва с тяхното извличане. Пакетите се използват по време на урока vroom, readxl, googlesheets4 за зареждане на данни в R среда от csv, tsv, Excel файлове и Google Sheets.
Урок 4: Филтриране на редове, избор и преименуване на колони, конвейери в R
Описание:
В това видео продължаваме запознанството си с библиотеката tidyverse и пакет dplyr.
Нека да разгледаме семейството от функции mutate()и ще научим как да ги използваме, за да добавяме нови изчисляеми колони към таблицата.
Описание:
Този урок е посветен на една от основните операции за анализ, групиране и агрегиране на данни. По време на урока ще използваме пакета dplyr функционирам group_by() и summarise().
Ще разгледаме цялото семейство от функции summarise(), това е summarise(), summarise_if() и summarise_at().
Урок 7: Вертикално и хоризонтално свързване на таблици в R
Описание:
Този урок ще ви помогне да разберете операциите по вертикално и хоризонтално свързване на таблици.
Вертикалното обединение е еквивалентът на операцията UNION в езика за заявки SQL.
Хоризонталното свързване е по-известно на потребителите на Excel благодарение на функцията VLOOKUP; в SQL такива операции се извършват от оператора JOIN.
По време на урока ще решим практическа задача, по време на която ще използваме пакети dplyr, readxl, tidyr и stringr.
Основните функции, които ще разгледаме:
bind_rows() - вертикално свързване на таблици
left_join() — хоризонтално свързване на таблици
semi_join() - включително съединяване на таблици
anti_join() - изключително присъединяване към маса
Описание:
Функциите на прозореца са подобни по значение на тези за агрегиране; те също приемат масив от стойности като вход и извършват аритметични операции върху тях, но не променят броя на редовете в изходния резултат.
В този урок ние продължаваме да изучаваме пакета dplyr, и функции group_by(), mutate(), както и нови cumsum(), lag(), lead() и arrange().
Урок 9: Ротационни таблици или аналог на обобщени таблици в R
Описание:
Повечето потребители на Excel използват осеви таблици; това е удобен инструмент, с който можете да превърнете масив от необработени данни в отчети за четене за секунди.
В този урок ще разгледаме как да завъртаме таблици в R и да ги конвертираме от широк в дълъг формат и обратно.
По-голямата част от урока е посветена на опаковката tidyr и функции pivot_longer() и pivot_wider().
Урок 10: Зареждане на JSON файлове в R и конвертиране на списъци в таблици
Описание:
JSON и XML са изключително популярни формати за съхранение и обмен на информация, обикновено поради своята компактност.
Но е трудно да се анализират данни, представени в такива формати, така че преди анализ е необходимо да ги приведете в таблична форма, което е точно това, което ще научим в това видео.
Урокът е посветен на опаковката tidyr, включени в ядрото на библиотеката tidyverse, и функции unnest_longer(), unnest_wider() и hoist().
Урок 11: Бързо чертане с помощта на функцията qplot().
Описание:
Урокът демонстрира пълната мощ на пакета ggplot2 и граматиката на изграждане на графики в слоеве, вградени в него.
Ще анализираме основните геометрии, които присъстват в пакета, и ще научим как да прилагаме слоеве за изграждане на графика.
Заключение
Опитах се да подходя към формирането на програмата на курса възможно най-кратко, за да подчертая само най-необходимата информация, която ще ви е необходима, за да направите първите стъпки в изучаването на такъв мощен инструмент за анализ на данни като езика R.
Курсът не е изчерпателно ръководство за анализ на данни с помощта на R, но ще ви помогне да разберете всички необходими техники за това.
Докато програмата на курса е предназначена за 12 седмици, всяка седмица в понеделник ще отварям достъп до нови уроци, така че препоръчвам Абонирай се в канала на YouTube, за да не пропуснете публикуването на нов урок.