Мова R для користувачів Excel (безкоштовний відео курс)

У зв'язку з карантином багато хто зараз левову частку часу проводять вдома, і цей час можна, і навіть потрібно провести з користю.

На початку карантину я вирішив довести до пуття деякі проекти розпочаті кілька місяців тому. Одним із таких проектів був відео курс "Мова R для користувачів Excel". Цим курсом я хотів знизити поріг входження в R, і трохи заповнити існуючий дефіцит навчальних матеріалів на цю тему російською мовою.

Якщо всю роботу з даними в компанії, в якій ви працюєте, як і раніше, вести в Excel, то пропоную вам познайомитися з більш сучасним, і при цьому абсолютно безкоштовним інструментом аналізу даних.

Мова R для користувачів Excel (безкоштовний відео курс)

Зміст

Якщо ви цікавитеся аналізом даних можливо вам будуть цікаві мої телеграма и YouTube канали. Більшість контенту яких присвячені мові R.

  1. Посилання
  2. Про курс
  3. Для кого цей курс
  4. програма курсу
    4.1. Урок 1: Встановлення мови R та середовища розробки RStudio
    4.2. Урок 2: Основні структури даних у R
    4.3. Урок 3: Читання даних з TSV, CSV, Excel файлів та Google Таблиць
    4.4. Урок 4: Фільтрування рядків, вибір та перейменування стовпців, пайплани в R
    4.5. Урок 5: Додавання обчислюваних стовпців у таблицю мовою R
    4.6. Урок 6: Угруповання та агрегація даних мовою R
    4.7. Урок 7: Вертикальне та горизонтальне об'єднання таблиць на мові R
    4.8. Урок 8: Віконні функції у R
    4.9. Урок 9: Обертання таблиць або аналог зведених таблиць у R
    4.10. Урок 10: Завантаження JSON файлів у R та перетворення списків у таблиці
    4.11. Урок 11: Швидка побудова графіків за допомогою функції qplot()
    4.12. Урок 12: Побудова графіків шар за шаром за допомогою пакета ggplot2
  5. Висновок

Посилання

Про курс

Курс побудований навколо архітектури tidyverse, і пакетів, що входять до неї: readr, vroom, dplyr, tidyr, ggplot2. Звичайно в R є інші хороші пакети виконують подібні операції, наприклад data.table, але синтаксис tidyverse інтуїтивно зрозумілий, його легко читати навіть непідготовленому користувачеві, тому я думаю, що починати навчання мови краще саме з tidyverse.

Курс проведе вас через усі операції з аналізу даних, від завантаження до візуалізації готового результату.

Чому саме мова R, а не Python? Тому що R функціональна мова, користувачам Excel нею перейти легше, т.к. не треба вникати у традиційне об'єктно-орієнтоване програмування.

Наразі заплановано 12 відео уроків тривалістю від 5 до 20 хвилин кожен.

Уроки відкриватимуться поступово. Щопонеділка я відкриватиму доступ до нового уроку у себе на YouTube каналі в окремому плей аркуші.

Для кого цей курс

Думаю це зрозуміло з назви, проте опишу докладніше.

Курс орієнтований на тих, хто в роботі активно використовує Microsoft Excel і там реалізує всю роботу з даними. Загалом, якщо ви відкриваєте програму Microsoft Excel хоча б раз на тиждень, то курс вам підійде.

Навичок програмування для проходження курсу вам не потрібно, т.к. курс орієнтований на початківців.

Але, можливо починаючи з 4 уроку знайдеться цікавий матеріал і для активних користувачів R, т.к. основний функціонал таких пакетів як dplyr и tidyr буде розглянуто досить детально.

програма курсу

Урок 1: Встановлення мови R та середовища розробки RStudio

Дата публікації: 23 березня 2020

Посилання:

Відео:

Опис:
Вступний урок під час якого ми завантажуємо та встановимо необхідне програмне забезпечення, і трохи розберемо можливості та інтерфейс середовища розробки RStudio.

Урок 2: Основні структури даних у R

Дата публікації: 30 березня 2020

Посилання:

Відео:

Опис:
Цей урок допоможе вам розібратися з тим, які структури даних є у мові R. Ми детально розберемо вектори, дату кадрів та списки. Навчимося їх створювати та звертатися до їх окремих елементів.

Урок 3: Читання даних з TSV, CSV, Excel файлів та Google Таблиць

Дата публікації: 6 квітня 2020

Посилання:

Відео:

Опис:
Робота з даними, незалежно від інструмента, починається з їхньої видобутку. У ході уроку використовуються пакети vroom, readxl, googlesheets4 для завантаження даних у середовище R з csv, tsv, Excel файлів та Google Таблиць.

Урок 4: Фільтрування рядків, вибір та перейменування стовпців, пайплани в R

Дата публікації: 13 квітня 2020

Посилання:

Відео:

Опис:
Цей урок присвячений пакету dplyr. У ньому ми розберемося як фільтрувати датафрейми, вибирати потрібні стовпці та перейменовувати їх.

Також дізнаємося, що таке пайплани і як вони допомагають робити ваш код на мові R більш читабельним.

Урок 5: Додавання обчислюваних стовпців у таблицю мовою R

Дата публікації: 20 квітня 2020

Посилання:

Відео:

Опис:
У цьому відео ми продовжуємо знайомство з бібліотекою tidyverse та пакетом dplyr.
Розберемо сімейство функцій mutate(), і навчимося з їх допомогою додавати в таблицю нові стовпці, що обчислюються.

Урок 6: Угруповання та агрегація даних мовою R

Дата публікації: 27 квітня 2020

Посилання:

Відео:

Опис:
Цей урок присвячений одній з основних операцій аналізу даних, угрупованню та агрегації. Під час уроку ми будемо використовувати пакет dplyr та функції group_by() и summarise().

Ми розглянемо все сімейство функцій summarise(), Тобто summarise(), summarise_if() и summarise_at().

Урок 7: Вертикальне та горизонтальне об'єднання таблиць на мові R

Дата публікації: 4 травня 2020

Посилання:

Відео:

Опис:
Цей урок допоможе вам розібратися з операціями вертикального та горизонтального поєднання таблиць.

Вертикальне поєднання є аналогом операції UNION у мові запитів SQL.

Горизонтальне об'єднання користувачам Excel більш відоме завдяки функції ВПР, SQL такі операції здійснюються оператором JOIN.

Під час уроку ми вирішимо практичне завдання, під час якого будемо використовувати пакети dplyr, readxl, tidyr и stringr.

Основні функції, які ми розглянемо:

  • bind_rows() - вертикальне об'єднання таблиць
  • left_join() - горизонтальне об'єднання таблиць
  • semi_join() - включає об'єднання таблиць
  • anti_join() - Виключне об'єднання таблиць

Урок 8: Віконні функції у R

Дата публікації: 11 травня 2020

Посилання:

Опис:
Віконні функції за змістом схожі на агрегують, вони також приймають на вхід масив значень і проводять над ними арифметичні операції, але в результаті не змінюють кількість рядків.

У цьому уроці ми продовжуємо вивчати пакет dplyr, та функції group_by(), mutate(), а також нові cumsum(), lag(), lead() и arrange().

Урок 9: Обертання таблиць або аналог зведених таблиць у R

Дата публікації: 18 травня 2020

Посилання:

Опис:
Більшість користувачів Excel використовують зведені таблиці, це зручний інструмент, за допомогою якого ви можете за лічені секунди перетворити масив сирих даних на читальні звіти.

У цьому уроці ми розберемося з тим як обертати таблиці в R, і перетворювати їх з широкого формату на довгий і навпаки.

Більшість уроку присвячена пакету tidyr та функцій pivot_longer() и pivot_wider().

Урок 10: Завантаження JSON файлів у R та перетворення списків у таблиці

Дата публікації: 25 травня 2020

Посилання:

Опис:
JSON та XML є надзвичайно популярними форматами зберігання та обміну інформацією, як правило, за рахунок своєї компактності.

Але аналізувати дані представлені в таких форматах складно, тому їх перед аналізом необхідно привести до табличного вигляду, саме цьому ми навчимося в даному відео.

Урок присвячений пакету tidyr, що входить до ядра бібліотеки tidyverse, та функцій unnest_longer(), unnest_wider() и hoist().

Урок 11: Швидка побудова графіків за допомогою функції qplot()

Дата публікації: 1 червня 2020

Посилання:

Опис:
Пакет ggplot2 є одним з найбільш популярних засобів візуалізації даних не тільки R.

У цьому уроці ми навчимося побудові найпростіших графіків за допомогою функції qplot(), і розберемо її аргументи.

Урок 12: Побудова графіків шар за шаром за допомогою пакета ggplot2

Дата публікації: 8 червня 2020

Посилання:

Опис:
В уроці продемонстровано всю потужність пакету ggplot2 та закладеної в нього граматики побудови графіків шарами.

Ми розберемо основні геометрії які є в пакеті і навчимося накладати шари для побудови графіка.

Висновок

Я намагався підійти до формування програми курсу максимально лаконічно, виділити тільки найнеобхіднішу інформацію, яка знадобиться вам для того, щоб зробити перші кроки у вивченні такого потужного інструменту аналізу даних як мова R.

Курс не є вичерпним посібником з аналізу даних за допомогою мови R, але допоможе вам розібратися з усіма необхідними для цього прийомами.

Поки програма курсу розрахована на 12 тижнів, щотижня, по понеділках я відкриватиму доступ до нових уроків, тому рекомендую підписатися на YouTube канал, щоб не пропустити публікацію нового уроку.

Джерело: habr.com

Додати коментар або відгук