Język R dla użytkowników programu Excel (bezpłatny kurs wideo)
W związku z kwarantanną wiele osób spędza obecnie lwią część swojego czasu w domu i ten czas można, a nawet należy wykorzystać pożytecznie.
Na początku kwarantanny postanowiłem dokończyć kilka projektów, które zacząłem kilka miesięcy temu. Jednym z takich projektów był kurs wideo „Język R dla użytkowników Excela”. Tym kursem chciałem obniżyć barierę wejścia na R i nieco uzupełnić istniejące braki materiałów szkoleniowych na ten temat w języku rosyjskim.
Jeśli w firmie, w której pracujesz, cała praca z danymi nadal odbywa się w Excelu, to proponuję zapoznać się z nowocześniejszym, a jednocześnie całkowicie darmowym narzędziem do analizy danych.
Zawartość
Jeśli interesuje Cię analiza danych, być może zainteresuje Cię mój telegram и youtube kanały. Większość treści jest poświęcona językowi R.
Zajęcia skupiają się wokół architektury tidyverseoraz zawarte w nim pakiety: readr, vroom, dplyr, tidyr, ggplot2. Oczywiście istnieją inne dobre pakiety w R, które wykonują na przykład podobne operacje data.table, ale składnia tidyverse intuicyjny, łatwy do odczytania nawet dla nieprzeszkolonego użytkownika, dlatego myślę, że lepiej zacząć naukę języka R tidyverse.
Kurs poprowadzi Cię przez wszystkie operacje analizy danych, od załadowania po wizualizację gotowego wyniku.
Dlaczego R, a nie Python? Ponieważ R jest językiem funkcjonalnym, użytkownikom programu Excel łatwiej jest się na niego przełączyć, ponieważ nie ma potrzeby zagłębiania się w tradycyjne programowanie obiektowe.
Na chwilę obecną zaplanowanych jest 12 lekcji wideo, każda trwających od 5 do 20 minut.
Lekcje będą otwierane stopniowo. W każdy poniedziałek będę otwierać dostęp do nowej lekcji na mojej stronie internetowej. Kanał Youtube na osobnej liście odtwarzania.
Dla kogo jest ten kurs?
Myślę, że wynika to jasno z tytułu, jednak opiszę to bardziej szczegółowo.
Kurs skierowany jest do osób, które aktywnie wykorzystują w swojej pracy program Microsoft Excel i całą swoją pracę z danymi realizują właśnie w nim. Ogólnie rzecz biorąc, jeśli przynajmniej raz w tygodniu otwierasz aplikację Microsoft Excel, to kurs jest dla Ciebie odpowiedni.
Do ukończenia kursu nie jest wymagana umiejętność programowania, ponieważ... Kurs skierowany jest do osób początkujących.
Ale być może, począwszy od lekcji 4, będzie interesujący materiał także dla aktywnych użytkowników R, ponieważ... główna funkcjonalność takich pakietów jak dplyr и tidyr zostaną omówione bardziej szczegółowo.
Program kursu
Lekcja 1: Instalowanie języka R i środowiska programistycznego RStudio
Opis:
Lekcja wprowadzająca, podczas której pobierzemy i zainstalujemy niezbędne oprogramowanie oraz pokrótce przeanalizujemy możliwości i interfejs środowiska programistycznego RStudio.
Opis:
Ta lekcja pomoże Ci zrozumieć, jakie struktury danych są dostępne w języku R. Przyjrzymy się szczegółowo wektorom, ramkom dat i listom. Nauczmy się, jak je tworzyć i uzyskać dostęp do ich poszczególnych elementów.
Lekcja 3: Odczyt danych z plików TSV, CSV, Excel i Arkuszy Google
Opis:
Praca z danymi, niezależnie od narzędzia, rozpoczyna się od ich wyodrębnienia. Pakiety są wykorzystywane podczas lekcji vroom, readxl, googlesheets4 do ładowania danych do środowiska R z plików csv, tsv, Excel i Arkuszy Google.
Lekcja 4: Filtrowanie wierszy, wybieranie i zmiana nazw kolumn, potoków w R
Opis:
W tym filmie kontynuujemy naszą znajomość biblioteki tidyverse i pakiet dplyr.
Spójrzmy na rodzinę funkcji mutate(), a my nauczymy się ich używać do dodawania nowych kolumn wyliczanych do tabeli.
Opis:
Ta lekcja poświęcona jest jednej z głównych operacji analizy, grupowania i agregacji danych. Podczas lekcji będziemy korzystać z pakietu dplyr i funkcje group_by() и summarise().
Przyjrzymy się całej rodzinie funkcji summarise()tj. summarise(), summarise_if() и summarise_at().
Opis:
Funkcje okna mają podobne znaczenie do funkcji agregujących, przyjmują również tablicę wartości jako dane wejściowe i wykonują na nich operacje arytmetyczne, ale nie zmieniają liczby wierszy w wyniku wyjściowym.
W tym samouczku będziemy kontynuować naukę pakietu dplyri funkcje group_by(), mutate(), a także nowe cumsum(), lag(), lead() и arrange().
Lekcja 9: Stoły obrotowe lub analogia tabel przestawnych w R
Opis:
Większość użytkowników Excela korzysta z tabel przestawnych; jest to wygodne narzędzie, dzięki któremu w ciągu kilku sekund możesz zamienić tablicę surowych danych w czytelne raporty.
W tym samouczku przyjrzymy się, jak obracać tabele w R i konwertować je z formatu szerokiego na długi i odwrotnie.
Większość lekcji poświęcona jest pakietowi tidyr i funkcje pivot_longer() и pivot_wider().
Lekcja 10: Ładowanie plików JSON w R i konwertowanie list na tabele
Opis:
JSON i XML to niezwykle popularne formaty przechowywania i wymiany informacji, zwykle ze względu na ich zwartość.
Trudno jednak analizować dane prezentowane w takich formatach, dlatego przed analizą należy sprowadzić je do postaci tabelarycznej, czego dokładnie dowiemy się w tym filmie.
Lekcja poświęcona jest pakietowi tidyr, zawarte w rdzeniu biblioteki tidyversei funkcje unnest_longer(), unnest_wider() и hoist().
Lekcja 11: Szybkie kreślenie za pomocą funkcji qplot().
Opis:
Lekcja pokazuje pełną moc pakietu ggplot2 oraz gramatykę budowania grafów w osadzonych w nim warstwach.
Przeanalizujemy główne geometrie obecne w pakiecie i nauczymy się, jak nakładać warstwy, aby zbudować wykres.
wniosek
Starałem się podejść do tworzenia programu kursu możliwie zwięźle, aby podkreślić tylko najbardziej niezbędne informacje, które będą potrzebne, aby postawić pierwsze kroki w nauce tak potężnego narzędzia do analizy danych, jak język R.
Kurs nie jest wyczerpującym przewodnikiem po analizie danych przy użyciu języka R, ale pomoże Ci zrozumieć wszystkie niezbędne do tego techniki.
Choć program kursu jest zaplanowany na 12 tygodni, co tydzień w poniedziałki będę otwierał dostęp do nowych lekcji, dlatego polecam subskrybować na kanale YouTube, aby nie przegapić publikacji nowej lekcji.