Jazyk R pro uživatele Excelu (bezplatný videokurz)
Kvůli karanténě nyní mnozí tráví lví podíl svého času doma a tento čas lze, a dokonce by měl, strávit užitečně.
Na začátku karantény jsem se rozhodl dokončit některé projekty, které jsem začal před pár měsíci. Jedním z těchto projektů byl videokurz „Jazyk R pro uživatele Excelu“. Tímto kurzem jsem chtěl snížit bariéru vstupu do R a trochu vyplnit stávající nedostatek školicích materiálů na toto téma v ruštině.
Pokud veškerá práce s daty ve firmě, pro kterou pracujete, stále probíhá v Excelu, pak vám doporučuji seznámit se s modernějším a zároveň zcela bezplatným nástrojem pro analýzu dat.
Obsah
Pokud vás zajímá analýza dat, mohla by vás zajímat moje telegram и Youtube kanály. Většina obsahu je věnována jazyku R.
Kurz je strukturován kolem architektury tidyversea balíčky v něm obsažené: readr, vroom, dplyr, tidyr, ggplot2. Samozřejmě existují i další dobré balíčky v R, které provádějí například podobné operace data.table, ale syntaxe tidyverse intuitivní, snadno čitelný i pro netrénovaného uživatele, takže si myslím, že je lepší začít se učit jazyk R s tidyverse.
Kurz vás provede všemi operacemi analýzy dat, od načítání až po vizualizaci hotového výsledku.
Proč R a ne Python? Protože R je funkční jazyk, je pro uživatele Excelu snazší na něj přejít, protože není třeba se ponořit do tradičního objektově orientovaného programování.
V tuto chvíli je naplánováno 12 videolekcí, každá v délce od 5 do 20 minut.
Lekce se budou otevírat postupně. Každé pondělí otevřu přístup k nové lekci na mém webu. Kanál YouTube v samostatném seznamu skladeb.
Pro koho je tento kurz určen?
Myslím, že to je z názvu jasné, nicméně popíšu to podrobněji.
Kurz je zaměřen na ty, kteří při své práci aktivně používají Microsoft Excel a realizují tam veškerou svou práci s daty. Obecně platí, že pokud otevřete aplikaci Microsoft Excel alespoň jednou týdně, pak je kurz pro vás vhodný.
K absolvování kurzu nemusíte mít znalosti programování, protože... Kurz je zaměřen na začátečníky.
Ale možná, počínaje lekcí 4, bude zajímavý materiál i pro aktivní uživatele R, protože... hlavní funkce takových balíčků, jako je dplyr и tidyr bude pojednáno poněkud podrobněji.
Program kurzu
Lekce 1: Instalace jazyka R a vývojového prostředí RStudio
Popis:
Tato lekce vám pomůže pochopit, jaké datové struktury jsou dostupné v jazyce R. Podrobně se podíváme na vektory, datové rámce a seznamy. Pojďme se naučit, jak je vytvářet a přistupovat k jejich jednotlivým prvkům.
Lekce 3: Čtení dat ze souborů TSV, CSV, Excel a Tabulek Google
Popis:
Práce s daty bez ohledu na nástroj začíná jejich extrakcí. Balíčky se používají během lekce vroom, readxl, googlesheets4 pro načítání dat do prostředí R ze souborů csv, tsv, Excel a Google Sheets.
Lekce 4: Filtrování řádků, výběr a přejmenování sloupců, potrubí v R
Popis:
V tomto videu pokračujeme v seznámení s knihovnou tidyverse a balíček dplyr.
Podívejme se na rodinu funkcí mutate(), a naučíme se je používat k přidávání nových počítaných sloupců do tabulky.
Popis:
Tato lekce je věnována jedné z hlavních operací analýzy, seskupování a agregace dat. Během lekce balíček využijeme dplyr a funkce group_by() и summarise().
Podíváme se na celou rodinu funkcí summarise(), tj. summarise(), summarise_if() и summarise_at().
Lekce 7: Vertikální a horizontální spojování tabulek v R
Popis:
Funkce oken mají podobný význam jako agregační; také berou pole hodnot jako vstup a provádějí s nimi aritmetické operace, ale nemění počet řádků ve výsledku výstupu.
V tomto tutoriálu pokračujeme ve studiu balíčku dplyra funkcí group_by(), mutate(), stejně jako nové cumsum(), lag(), lead() и arrange().
Lekce 9: Otočné stoly nebo obdoba kontingenčních stolů v R
Popis:
Většina uživatelů aplikace Excel používá kontingenční tabulky; jedná se o pohodlný nástroj, pomocí kterého můžete během několika sekund přeměnit řadu nezpracovaných dat na čitelné sestavy.
V tomto tutoriálu se podíváme na to, jak otáčet tabulky v R a převádět je z širokého na dlouhý formát a naopak.
Většina lekce je věnována balíčku tidyr a funkcí pivot_longer() и pivot_wider().
Lekce 10: Načítání souborů JSON v R a převod seznamů na tabulky
Popis:
JSON a XML jsou extrémně oblíbené formáty pro ukládání a výměnu informací, obvykle kvůli jejich kompaktnosti.
Ale je obtížné analyzovat data prezentovaná v takových formátech, takže před analýzou je nutné je převést do tabulkové formy, což je přesně to, co se dozvíme v tomto videu.
Lekce je věnována balíčku tidyr, která je součástí jádra knihovny tidyversea funkcí unnest_longer(), unnest_wider() и hoist().
Lekce 11: Rychlé vykreslování pomocí funkce qplot().
Popis:
Lekce ukazuje plnou sílu balíčku ggplot2 a gramatika vytváření grafů ve vrstvách v něm vložených.
Budeme analyzovat hlavní geometrie, které jsou přítomné v balíčku, a naučíme se, jak použít vrstvy k vytvoření grafu.
Závěr
Snažil jsem se přistoupit k tvorbě programu kurzu co nejstručněji, vyzdvihnout jen ty nejnutnější informace, které budete potřebovat k tomu, abyste se naučili tak mocný nástroj pro analýzu dat, jakým je jazyk R.
Kurz není vyčerpávajícím průvodcem analýzy dat pomocí R, ale pomůže vám porozumět všem technikám nezbytným k tomu.
Zatímco program kurzu je koncipován na 12 týdnů, každý týden v pondělí otevřu přístup k novým lekcím, takže doporučuji přihlásit se k odběru na kanálu YouTube, abyste nezmeškali zveřejnění nové lekce.