Jazyk R pro uživatele Excelu (bezplatný videokurz)

Kvůli karanténě nyní mnozí tráví lví podíl svého času doma a tento čas lze, a dokonce by měl, strávit užitečně.

Na začátku karantény jsem se rozhodl dokončit některé projekty, které jsem začal před pár měsíci. Jedním z těchto projektů byl videokurz „Jazyk R pro uživatele Excelu“. Tímto kurzem jsem chtěl snížit bariéru vstupu do R a trochu vyplnit stávající nedostatek školicích materiálů na toto téma v ruštině.

Pokud veškerá práce s daty ve firmě, pro kterou pracujete, stále probíhá v Excelu, pak vám doporučuji seznámit se s modernějším a zároveň zcela bezplatným nástrojem pro analýzu dat.

Jazyk R pro uživatele Excelu (bezplatný videokurz)

Obsah

Pokud vás zajímá analýza dat, mohla by vás zajímat moje telegram и Youtube kanály. Většina obsahu je věnována jazyku R.

  1. reference
  2. O kurzu
  3. Pro koho je tento kurz určen?
  4. Program kurzu
    4.1. Lekce 1: Instalace jazyka R a vývojového prostředí RStudio
    4.2. Lekce 2: Základní datové struktury v R
    4.3. Lekce 3: Čtení dat ze souborů TSV, CSV, Excel a Tabulek Google
    4.4. Lekce 4: Filtrování řádků, výběr a přejmenování sloupců, potrubí v R
    4.5. Lekce 5: Přidání vypočítaných sloupců do tabulky v R
    4.6. Lekce 6: Seskupování a agregace dat v R
    4.7. Lekce 7: Vertikální a horizontální spojování tabulek v R
    4.8. Lekce 8: Funkce okna v R
    4.9. Lekce 9: Otočné stoly nebo obdoba kontingenčních stolů v R
    4.10. Lekce 10: Načítání souborů JSON v R a převod seznamů na tabulky
    4.11. Lekce 11: Rychlé vykreslování pomocí funkce qplot().
    4.12. Lekce 12: Vykreslování vrstev po vrstvách Pomocí balíčku ggplot2
  5. Závěr

reference

O kurzu

Kurz je strukturován kolem architektury tidyversea balíčky v něm obsažené: readr, vroom, dplyr, tidyr, ggplot2. Samozřejmě existují i ​​další dobré balíčky v R, které provádějí například podobné operace data.table, ale syntaxe tidyverse intuitivní, snadno čitelný i pro netrénovaného uživatele, takže si myslím, že je lepší začít se učit jazyk R s tidyverse.

Kurz vás provede všemi operacemi analýzy dat, od načítání až po vizualizaci hotového výsledku.

Proč R a ne Python? Protože R je funkční jazyk, je pro uživatele Excelu snazší na něj přejít, protože není třeba se ponořit do tradičního objektově orientovaného programování.

V tuto chvíli je naplánováno 12 videolekcí, každá v délce od 5 do 20 minut.

Lekce se budou otevírat postupně. Každé pondělí otevřu přístup k nové lekci na mém webu. Kanál YouTube v samostatném seznamu skladeb.

Pro koho je tento kurz určen?

Myslím, že to je z názvu jasné, nicméně popíšu to podrobněji.

Kurz je zaměřen na ty, kteří při své práci aktivně používají Microsoft Excel a realizují tam veškerou svou práci s daty. Obecně platí, že pokud otevřete aplikaci Microsoft Excel alespoň jednou týdně, pak je kurz pro vás vhodný.

K absolvování kurzu nemusíte mít znalosti programování, protože... Kurz je zaměřen na začátečníky.

Ale možná, počínaje lekcí 4, bude zajímavý materiál i pro aktivní uživatele R, protože... hlavní funkce takových balíčků, jako je dplyr и tidyr bude pojednáno poněkud podrobněji.

Program kurzu

Lekce 1: Instalace jazyka R a vývojového prostředí RStudio

Datum vydání: 23 2020 марта

Odkazy:

Video:

Popis:
Úvodní lekce, během které si stáhneme a nainstalujeme potřebný software a krátce prozkoumáme možnosti a rozhraní vývojového prostředí RStudio.

Lekce 2: Základní datové struktury v R

Datum vydání: 30 2020 марта

Odkazy:

Video:

Popis:
Tato lekce vám pomůže pochopit, jaké datové struktury jsou dostupné v jazyce R. Podrobně se podíváme na vektory, datové rámce a seznamy. Pojďme se naučit, jak je vytvářet a přistupovat k jejich jednotlivým prvkům.

Lekce 3: Čtení dat ze souborů TSV, CSV, Excel a Tabulek Google

Datum vydání: 6 2020 апреля

Odkazy:

Video:

Popis:
Práce s daty bez ohledu na nástroj začíná jejich extrakcí. Balíčky se používají během lekce vroom, readxl, googlesheets4 pro načítání dat do prostředí R ze souborů csv, tsv, Excel a Google Sheets.

Lekce 4: Filtrování řádků, výběr a přejmenování sloupců, potrubí v R

Datum vydání: 13 2020 апреля

Odkazy:

Video:

Popis:
Tato lekce je o balíčku dplyr. V něm zjistíme, jak filtrovat datové rámce, vybrat potřebné sloupce a přejmenovat je.

Dozvíme se také, co jsou to pipelines a jak pomáhají, aby byl váš R kód čitelnější.

Lekce 5: Přidání vypočítaných sloupců do tabulky v R

Datum vydání: 20 2020 апреля

Odkazy:

Video:

Popis:
V tomto videu pokračujeme v seznámení s knihovnou tidyverse a balíček dplyr.
Podívejme se na rodinu funkcí mutate(), a naučíme se je používat k přidávání nových počítaných sloupců do tabulky.

Lekce 6: Seskupování a agregace dat v R

Datum vydání: 27 2020 апреля

Odkazy:

Video:

Popis:
Tato lekce je věnována jedné z hlavních operací analýzy, seskupování a agregace dat. Během lekce balíček využijeme dplyr a funkce group_by() и summarise().

Podíváme se na celou rodinu funkcí summarise(), tj. summarise(), summarise_if() и summarise_at().

Lekce 7: Vertikální a horizontální spojování tabulek v R

Datum vydání: 4 2020 мая

Odkazy:

Video:

Popis:
Tato lekce vám pomůže pochopit operace vertikálního a horizontálního spojování tabulek.

Vertikální sjednocení je ekvivalentem operace UNION v dotazovacím jazyce SQL.

Horizontální spojení je uživatelům Excelu známější díky funkci VLOOKUP, v SQL takové operace provádí operátor JOIN.

Během lekce vyřešíme praktický problém, při kterém využijeme balíčky dplyr, readxl, tidyr и stringr.

Hlavní funkce, které budeme zvažovat:

  • bind_rows() - svislé spojení stolů
  • left_join() — horizontální spojení stolů
  • semi_join() - včetně spojovacích stolů
  • anti_join() - exkluzivní připojení ke stolu

Lekce 8: Funkce okna v R

Datum vydání: 11 2020 мая

Odkazy:

Popis:
Funkce oken mají podobný význam jako agregační; také berou pole hodnot jako vstup a provádějí s nimi aritmetické operace, ale nemění počet řádků ve výsledku výstupu.

V tomto tutoriálu pokračujeme ve studiu balíčku dplyra funkcí group_by(), mutate(), stejně jako nové cumsum(), lag(), lead() и arrange().

Lekce 9: Otočné stoly nebo obdoba kontingenčních stolů v R

Datum vydání: 18 2020 мая

Odkazy:

Popis:
Většina uživatelů aplikace Excel používá kontingenční tabulky; jedná se o pohodlný nástroj, pomocí kterého můžete během několika sekund přeměnit řadu nezpracovaných dat na čitelné sestavy.

V tomto tutoriálu se podíváme na to, jak otáčet tabulky v R a převádět je z širokého na dlouhý formát a naopak.

Většina lekce je věnována balíčku tidyr a funkcí pivot_longer() и pivot_wider().

Lekce 10: Načítání souborů JSON v R a převod seznamů na tabulky

Datum vydání: 25 2020 мая

Odkazy:

Popis:
JSON a XML jsou extrémně oblíbené formáty pro ukládání a výměnu informací, obvykle kvůli jejich kompaktnosti.

Ale je obtížné analyzovat data prezentovaná v takových formátech, takže před analýzou je nutné je převést do tabulkové formy, což je přesně to, co se dozvíme v tomto videu.

Lekce je věnována balíčku tidyr, která je součástí jádra knihovny tidyversea funkcí unnest_longer(), unnest_wider() и hoist().

Lekce 11: Rychlé vykreslování pomocí funkce qplot().

Datum vydání: 1 2020 июня

Odkazy:

Popis:
Balíček ggplot2 je jedním z nejoblíbenějších nástrojů pro vizualizaci dat nejen v R.

V této lekci se naučíme vytvářet jednoduché grafy pomocí funkce qplot(), a pojďme analyzovat všechny její argumenty.

Lekce 12: Vykreslování vrstev po vrstvách Pomocí balíčku ggplot2

Datum vydání: 8 2020 июня

Odkazy:

Popis:
Lekce ukazuje plnou sílu balíčku ggplot2 a gramatika vytváření grafů ve vrstvách v něm vložených.

Budeme analyzovat hlavní geometrie, které jsou přítomné v balíčku, a naučíme se, jak použít vrstvy k vytvoření grafu.

Závěr

Snažil jsem se přistoupit k tvorbě programu kurzu co nejstručněji, vyzdvihnout jen ty nejnutnější informace, které budete potřebovat k tomu, abyste se naučili tak mocný nástroj pro analýzu dat, jakým je jazyk R.

Kurz není vyčerpávajícím průvodcem analýzy dat pomocí R, ale pomůže vám porozumět všem technikám nezbytným k tomu.

Zatímco program kurzu je koncipován na 12 týdnů, každý týden v pondělí otevřu přístup k novým lekcím, takže doporučuji přihlásit se k odběru na kanálu YouTube, abyste nezmeškali zveřejnění nové lekce.

Zdroj: www.habr.com

Přidat komentář