Język R dla użytkowników programu Excel (bezpłatny kurs wideo)

W związku z kwarantanną wiele osób spędza obecnie lwią część swojego czasu w domu i ten czas można, a nawet należy wykorzystać pożytecznie.

Na początku kwarantanny postanowiłem dokończyć kilka projektów, które zacząłem kilka miesięcy temu. Jednym z takich projektów był kurs wideo „Język R dla użytkowników Excela”. Tym kursem chciałem obniżyć barierę wejścia na R i nieco uzupełnić istniejące braki materiałów szkoleniowych na ten temat w języku rosyjskim.

Jeśli w firmie, w której pracujesz, cała praca z danymi nadal odbywa się w Excelu, to proponuję zapoznać się z nowocześniejszym, a jednocześnie całkowicie darmowym narzędziem do analizy danych.

Język R dla użytkowników programu Excel (bezpłatny kurs wideo)

Zawartość

Jeśli interesuje Cię analiza danych, być może zainteresuje Cię mój telegram и youtube kanały. Większość treści jest poświęcona językowi R.

  1. referencje
  2. O kursie
  3. Dla kogo jest ten kurs?
  4. Program kursu
    4.1. Lekcja 1: Instalowanie języka R i środowiska programistycznego RStudio
    4.2. Lekcja 2: Podstawowe struktury danych w R
    4.3. Lekcja 3: Odczyt danych z plików TSV, CSV, Excel i Arkuszy Google
    4.4. Lekcja 4: Filtrowanie wierszy, wybieranie i zmiana nazw kolumn, potoków w R
    4.5. Lekcja 5: Dodawanie kolumn obliczeniowych do tabeli w R
    4.6. Lekcja 6: Grupowanie i agregowanie danych w R
    4.7. Lekcja 7: Łączenie tabel w pionie i poziomie w R
    4.8. Lekcja 8: Funkcje okna w R
    4.9. Lekcja 9: Stoły obrotowe lub analogia tabel przestawnych w R
    4.10. Lekcja 10: Ładowanie plików JSON w R i konwertowanie list na tabele
    4.11. Lekcja 11: Szybkie kreślenie za pomocą funkcji qplot().
    4.12. Lekcja 12: Drukowanie wykresów warstwa po warstwie przy użyciu pakietu ggplot2
  5. wniosek

referencje

O kursie

Zajęcia skupiają się wokół architektury tidyverseoraz zawarte w nim pakiety: readr, vroom, dplyr, tidyr, ggplot2. Oczywiście istnieją inne dobre pakiety w R, które wykonują na przykład podobne operacje data.table, ale składnia tidyverse intuicyjny, łatwy do odczytania nawet dla nieprzeszkolonego użytkownika, dlatego myślę, że lepiej zacząć naukę języka R tidyverse.

Kurs poprowadzi Cię przez wszystkie operacje analizy danych, od załadowania po wizualizację gotowego wyniku.

Dlaczego R, a nie Python? Ponieważ R jest językiem funkcjonalnym, użytkownikom programu Excel łatwiej jest się na niego przełączyć, ponieważ nie ma potrzeby zagłębiania się w tradycyjne programowanie obiektowe.

Na chwilę obecną zaplanowanych jest 12 lekcji wideo, każda trwających od 5 do 20 minut.

Lekcje będą otwierane stopniowo. W każdy poniedziałek będę otwierać dostęp do nowej lekcji na mojej stronie internetowej. Kanał Youtube na osobnej liście odtwarzania.

Dla kogo jest ten kurs?

Myślę, że wynika to jasno z tytułu, jednak opiszę to bardziej szczegółowo.

Kurs skierowany jest do osób, które aktywnie wykorzystują w swojej pracy program Microsoft Excel i całą swoją pracę z danymi realizują właśnie w nim. Ogólnie rzecz biorąc, jeśli przynajmniej raz w tygodniu otwierasz aplikację Microsoft Excel, to kurs jest dla Ciebie odpowiedni.

Do ukończenia kursu nie jest wymagana umiejętność programowania, ponieważ... Kurs skierowany jest do osób początkujących.

Ale być może, począwszy od lekcji 4, będzie interesujący materiał także dla aktywnych użytkowników R, ponieważ... główna funkcjonalność takich pakietów jak dplyr и tidyr zostaną omówione bardziej szczegółowo.

Program kursu

Lekcja 1: Instalowanie języka R i środowiska programistycznego RStudio

Data publikacji: Marzec 23 2020

Linki:

Video:

Opis:
Lekcja wprowadzająca, podczas której pobierzemy i zainstalujemy niezbędne oprogramowanie oraz pokrótce przeanalizujemy możliwości i interfejs środowiska programistycznego RStudio.

Lekcja 2: Podstawowe struktury danych w R

Data publikacji: Marzec 30 2020

Linki:

Video:

Opis:
Ta lekcja pomoże Ci zrozumieć, jakie struktury danych są dostępne w języku R. Przyjrzymy się szczegółowo wektorom, ramkom dat i listom. Nauczmy się, jak je tworzyć i uzyskać dostęp do ich poszczególnych elementów.

Lekcja 3: Odczyt danych z plików TSV, CSV, Excel i Arkuszy Google

Data publikacji: 6 kwietnia 2020

Linki:

Video:

Opis:
Praca z danymi, niezależnie od narzędzia, rozpoczyna się od ich wyodrębnienia. Pakiety są wykorzystywane podczas lekcji vroom, readxl, googlesheets4 do ładowania danych do środowiska R z plików csv, tsv, Excel i Arkuszy Google.

Lekcja 4: Filtrowanie wierszy, wybieranie i zmiana nazw kolumn, potoków w R

Data publikacji: 13 kwietnia 2020

Linki:

Video:

Opis:
Ta lekcja dotyczy pakietu dplyr. W nim dowiemy się, jak filtrować ramki danych, wybierać niezbędne kolumny i zmieniać ich nazwy.

Dowiemy się także, czym są potoki i w jaki sposób pomagają uczynić Twój kod R bardziej czytelnym.

Lekcja 5: Dodawanie kolumn obliczeniowych do tabeli w R

Data publikacji: 20 kwietnia 2020

Linki:

Video:

Opis:
W tym filmie kontynuujemy naszą znajomość biblioteki tidyverse i pakiet dplyr.
Spójrzmy na rodzinę funkcji mutate(), a my nauczymy się ich używać do dodawania nowych kolumn wyliczanych do tabeli.

Lekcja 6: Grupowanie i agregowanie danych w R

Data publikacji: 27 kwietnia 2020

Linki:

Video:

Opis:
Ta lekcja poświęcona jest jednej z głównych operacji analizy, grupowania i agregacji danych. Podczas lekcji będziemy korzystać z pakietu dplyr i funkcje group_by() и summarise().

Przyjrzymy się całej rodzinie funkcji summarise()tj. summarise(), summarise_if() и summarise_at().

Lekcja 7: Łączenie tabel w pionie i poziomie w R

Data publikacji: May 4 2020

Linki:

Video:

Opis:
Ta lekcja pomoże Ci zrozumieć działanie pionowego i poziomego łączenia tabel.

Unia pionowa jest odpowiednikiem operacji UNION w języku zapytań SQL.

Łączenie poziome jest lepiej znane użytkownikom Excela dzięki funkcji WYSZUKAJ.PIONOWO, w SQL takie operacje wykonuje operator JOIN.

Podczas lekcji rozwiążemy praktyczny problem podczas którego będziemy korzystać z pakietów dplyr, readxl, tidyr и stringr.

Główne funkcje, które rozważymy:

  • bind_rows() - łączenie pionowe tabel
  • left_join() — poziome łączenie tabel
  • semi_join() - łącznie z łączeniem stołów
  • anti_join() - ekskluzywne łączenie stołów

Lekcja 8: Funkcje okna w R

Data publikacji: May 11 2020

Linki:

Opis:
Funkcje okna mają podobne znaczenie do funkcji agregujących, przyjmują również tablicę wartości jako dane wejściowe i wykonują na nich operacje arytmetyczne, ale nie zmieniają liczby wierszy w wyniku wyjściowym.

W tym samouczku będziemy kontynuować naukę pakietu dplyri funkcje group_by(), mutate(), a także nowe cumsum(), lag(), lead() и arrange().

Lekcja 9: Stoły obrotowe lub analogia tabel przestawnych w R

Data publikacji: May 18 2020

Linki:

Opis:
Większość użytkowników Excela korzysta z tabel przestawnych; jest to wygodne narzędzie, dzięki któremu w ciągu kilku sekund możesz zamienić tablicę surowych danych w czytelne raporty.

W tym samouczku przyjrzymy się, jak obracać tabele w R i konwertować je z formatu szerokiego na długi i odwrotnie.

Większość lekcji poświęcona jest pakietowi tidyr i funkcje pivot_longer() и pivot_wider().

Lekcja 10: Ładowanie plików JSON w R i konwertowanie list na tabele

Data publikacji: May 25 2020

Linki:

Opis:
JSON i XML to niezwykle popularne formaty przechowywania i wymiany informacji, zwykle ze względu na ich zwartość.

Trudno jednak analizować dane prezentowane w takich formatach, dlatego przed analizą należy sprowadzić je do postaci tabelarycznej, czego dokładnie dowiemy się w tym filmie.

Lekcja poświęcona jest pakietowi tidyr, zawarte w rdzeniu biblioteki tidyversei funkcje unnest_longer(), unnest_wider() и hoist().

Lekcja 11: Szybkie kreślenie za pomocą funkcji qplot().

Data publikacji: Czerwca 1 2020

Linki:

Opis:
Pakiet ggplot2 to jedno z najpopularniejszych narzędzi do wizualizacji danych nie tylko w R.

Na tej lekcji nauczymy się budować proste wykresy za pomocą tej funkcji qplot()i przeanalizujmy wszystkie jej argumenty.

Lekcja 12: Drukowanie wykresów warstwa po warstwie przy użyciu pakietu ggplot2

Data publikacji: Czerwca 8 2020

Linki:

Opis:
Lekcja pokazuje pełną moc pakietu ggplot2 oraz gramatykę budowania grafów w osadzonych w nim warstwach.

Przeanalizujemy główne geometrie obecne w pakiecie i nauczymy się, jak nakładać warstwy, aby zbudować wykres.

wniosek

Starałem się podejść do tworzenia programu kursu możliwie zwięźle, aby podkreślić tylko najbardziej niezbędne informacje, które będą potrzebne, aby postawić pierwsze kroki w nauce tak potężnego narzędzia do analizy danych, jak język R.

Kurs nie jest wyczerpującym przewodnikiem po analizie danych przy użyciu języka R, ale pomoże Ci zrozumieć wszystkie niezbędne do tego techniki.

Choć program kursu jest zaplanowany na 12 tygodni, co tydzień w poniedziałki będę otwierał dostęp do nowych lekcji, dlatego polecam subskrybować na kanale YouTube, aby nie przegapić publikacji nowej lekcji.

Źródło: www.habr.com

Dodaj komentarz