Мова R для користувачів Excel (безкоштовний відео курс)
У зв'язку з карантином багато хто зараз левову частку часу проводять вдома, і цей час можна, і навіть потрібно провести з користю.
На початку карантину я вирішив довести до пуття деякі проекти розпочаті кілька місяців тому. Одним із таких проектів був відео курс "Мова R для користувачів Excel". Цим курсом я хотів знизити поріг входження в R, і трохи заповнити існуючий дефіцит навчальних матеріалів на цю тему російською мовою.
Якщо всю роботу з даними в компанії, в якій ви працюєте, як і раніше, вести в Excel, то пропоную вам познайомитися з більш сучасним, і при цьому абсолютно безкоштовним інструментом аналізу даних.
Зміст
Якщо ви цікавитеся аналізом даних можливо вам будуть цікаві мої телеграма и YouTube канали. Більшість контенту яких присвячені мові R.
Курс побудований навколо архітектури tidyverse, і пакетів, що входять до неї: readr, vroom, dplyr, tidyr, ggplot2. Звичайно в R є інші хороші пакети виконують подібні операції, наприклад data.table, але синтаксис tidyverse інтуїтивно зрозумілий, його легко читати навіть непідготовленому користувачеві, тому я думаю, що починати навчання мови краще саме з tidyverse.
Курс проведе вас через усі операції з аналізу даних, від завантаження до візуалізації готового результату.
Чому саме мова R, а не Python? Тому що R функціональна мова, користувачам Excel нею перейти легше, т.к. не треба вникати у традиційне об'єктно-орієнтоване програмування.
Наразі заплановано 12 відео уроків тривалістю від 5 до 20 хвилин кожен.
Уроки відкриватимуться поступово. Щопонеділка я відкриватиму доступ до нового уроку у себе на YouTube каналі в окремому плей аркуші.
Для кого цей курс
Думаю це зрозуміло з назви, проте опишу докладніше.
Курс орієнтований на тих, хто в роботі активно використовує Microsoft Excel і там реалізує всю роботу з даними. Загалом, якщо ви відкриваєте програму Microsoft Excel хоча б раз на тиждень, то курс вам підійде.
Навичок програмування для проходження курсу вам не потрібно, т.к. курс орієнтований на початківців.
Але, можливо починаючи з 4 уроку знайдеться цікавий матеріал і для активних користувачів R, т.к. основний функціонал таких пакетів як dplyr и tidyr буде розглянуто досить детально.
програма курсу
Урок 1: Встановлення мови R та середовища розробки RStudio
Опис:
Вступний урок під час якого ми завантажуємо та встановимо необхідне програмне забезпечення, і трохи розберемо можливості та інтерфейс середовища розробки RStudio.
Опис:
Цей урок допоможе вам розібратися з тим, які структури даних є у мові R. Ми детально розберемо вектори, дату кадрів та списки. Навчимося їх створювати та звертатися до їх окремих елементів.
Урок 3: Читання даних з TSV, CSV, Excel файлів та Google Таблиць
Опис:
Робота з даними, незалежно від інструмента, починається з їхньої видобутку. У ході уроку використовуються пакети vroom, readxl, googlesheets4 для завантаження даних у середовище R з csv, tsv, Excel файлів та Google Таблиць.
Урок 4: Фільтрування рядків, вибір та перейменування стовпців, пайплани в R
Опис:
У цьому відео ми продовжуємо знайомство з бібліотекою tidyverse та пакетом dplyr.
Розберемо сімейство функцій mutate(), і навчимося з їх допомогою додавати в таблицю нові стовпці, що обчислюються.
Опис:
Цей урок присвячений одній з основних операцій аналізу даних, угрупованню та агрегації. Під час уроку ми будемо використовувати пакет dplyr та функції group_by() и summarise().
Ми розглянемо все сімейство функцій summarise(), Тобто summarise(), summarise_if() и summarise_at().
Урок 7: Вертикальне та горизонтальне об'єднання таблиць на мові R
Опис:
Віконні функції за змістом схожі на агрегують, вони також приймають на вхід масив значень і проводять над ними арифметичні операції, але в результаті не змінюють кількість рядків.
У цьому уроці ми продовжуємо вивчати пакет dplyr, та функції group_by(), mutate(), а також нові cumsum(), lag(), lead() и arrange().
Урок 9: Обертання таблиць або аналог зведених таблиць у R
Опис:
Більшість користувачів Excel використовують зведені таблиці, це зручний інструмент, за допомогою якого ви можете за лічені секунди перетворити масив сирих даних на читальні звіти.
У цьому уроці ми розберемося з тим як обертати таблиці в R, і перетворювати їх з широкого формату на довгий і навпаки.
Більшість уроку присвячена пакету tidyr та функцій pivot_longer() и pivot_wider().
Урок 10: Завантаження JSON файлів у R та перетворення списків у таблиці
Опис:
JSON та XML є надзвичайно популярними форматами зберігання та обміну інформацією, як правило, за рахунок своєї компактності.
Але аналізувати дані представлені в таких форматах складно, тому їх перед аналізом необхідно привести до табличного вигляду, саме цьому ми навчимося в даному відео.
Урок присвячений пакету tidyr, що входить до ядра бібліотеки tidyverse, та функцій unnest_longer(), unnest_wider() и hoist().
Урок 11: Швидка побудова графіків за допомогою функції qplot()
Опис:
В уроці продемонстровано всю потужність пакету ggplot2 та закладеної в нього граматики побудови графіків шарами.
Ми розберемо основні геометрії які є в пакеті і навчимося накладати шари для побудови графіка.
Висновок
Я намагався підійти до формування програми курсу максимально лаконічно, виділити тільки найнеобхіднішу інформацію, яка знадобиться вам для того, щоб зробити перші кроки у вивченні такого потужного інструменту аналізу даних як мова R.
Курс не є вичерпним посібником з аналізу даних за допомогою мови R, але допоможе вам розібратися з усіма необхідними для цього прийомами.
Поки програма курсу розрахована на 12 тижнів, щотижня, по понеділках я відкриватиму доступ до нових уроків, тому рекомендую підписатися на YouTube канал, щоб не пропустити публікацію нового уроку.