R-Sprache für Excel-Benutzer (kostenloser Videokurs)

Aufgrund der Quarantäne verbringen viele mittlerweile den Löwenanteil ihrer Zeit zu Hause, und diese Zeit kann und sollte sogar sinnvoll genutzt werden.

Zu Beginn der Quarantäne habe ich beschlossen, einige Projekte abzuschließen, die ich vor einigen Monaten begonnen hatte. Eines dieser Projekte war der Videokurs „R-Sprache für Excel-Benutzer“. Mit diesem Kurs wollte ich die Hürde für den Einstieg in R senken und den bestehenden Mangel an Schulungsmaterialien zu diesem Thema auf Russisch ein wenig ausgleichen.

Wenn die gesamte Arbeit mit Daten in dem Unternehmen, für das Sie arbeiten, immer noch in Excel erfolgt, empfehle ich Ihnen, sich mit einem moderneren und gleichzeitig völlig kostenlosen Datenanalysetool vertraut zu machen.

R-Sprache für Excel-Benutzer (kostenloser Videokurs)

Inhalt

Wenn Sie sich für Datenanalyse interessieren, könnten Sie an meiner interessiert sein Telegram mit и Youtube Kanäle. Der größte Teil des Inhalts ist der R-Sprache gewidmet.

  1. Referenzen
  2. Über den Kurs
  3. Für wen ist dieser Kurs geeignet?
  4. Kursprogramm
    4.1 Lektion 1: Installation der R-Sprache und der RStudio-Entwicklungsumgebung
    4.2 Lektion 2: Grundlegende Datenstrukturen in R
    4.3 Lektion 3: Lesen von Daten aus TSV-, CSV-, Excel-Dateien und Google Sheets
    4.4 Lektion 4: Zeilen filtern, Spalten auswählen und umbenennen, Pipelines in R
    4.5 Lektion 5: Berechnete Spalten zu einer Tabelle in R hinzufügen
    4.6 Lektion 6: Gruppieren und Aggregieren von Daten in R
    4.7 Lektion 7: Vertikale und horizontale Verbindung von Tabellen in R
    4.8 Lektion 8: Fensterfunktionen in R
    4.9 Lektion 9: Rotierende Tabellen oder ein Analogon von Pivot-Tabellen in R
    4.10 Lektion 10: JSON-Dateien in R laden und Listen in Tabellen konvertieren
    4.11 Lektion 11: Schnelles Plotten mit der Funktion qplot()
    4.12 Lektion 12: Schichtweises Plotten mit dem Paket ggplot2
  5. Abschluss

Referenzen

Über den Kurs

Der Kurs ist rund um die Architektur strukturiert tidyverseund die darin enthaltenen Pakete: readr, vroom, dplyr, tidyr, ggplot2. Natürlich gibt es in R auch andere gute Pakete, die beispielsweise ähnliche Operationen durchführen data.table, aber die Syntax tidyverse intuitiv und auch für einen ungeübten Benutzer leicht zu lesen, daher denke ich, dass es besser ist, mit dem Erlernen der R-Sprache zu beginnen tidyverse.

Der Kurs führt Sie durch alle Datenanalysevorgänge, vom Laden bis zur Visualisierung des fertigen Ergebnisses.

Warum R und nicht Python? Da R eine funktionale Sprache ist, ist es für Excel-Benutzer einfacher, darauf umzusteigen, weil Sie müssen sich nicht mit der traditionellen objektorientierten Programmierung befassen.

Derzeit sind 12 Video-Lektionen mit einer Dauer von jeweils 5 bis 20 Minuten geplant.

Der Unterricht wird schrittweise eröffnet. Jeden Montag eröffne ich den Zugang zu einer neuen Lektion auf meiner Website. Youtube Kanal in einer separaten Playlist.

Für wen ist dieser Kurs geeignet?

Ich denke, dass dies aus dem Titel klar hervorgeht, ich werde es jedoch ausführlicher beschreiben.

Der Kurs richtet sich an diejenigen, die Microsoft Excel in ihrer Arbeit aktiv nutzen und dort alle ihre Arbeiten mit Daten umsetzen. Generell gilt: Wenn Sie die Anwendung Microsoft Excel mindestens einmal pro Woche öffnen, ist der Kurs für Sie geeignet.

Für den Abschluss des Kurses sind keine Programmierkenntnisse erforderlich, denn... Der Kurs richtet sich an Einsteiger.

Aber vielleicht gibt es ab Lektion 4 auch für aktive R-Benutzer interessantes Material, denn... die Hauptfunktionalität solcher Pakete wie dplyr и tidyr wird noch etwas ausführlicher besprochen.

Kursprogramm

Lektion 1: Installation der R-Sprache und der RStudio-Entwicklungsumgebung

Erscheinungsdatum: März 23 2020

Links:

Video:

Beschreibung:
Eine Einführungslektion, in der wir die erforderliche Software herunterladen und installieren und kurz die Funktionen und Schnittstelle der RStudio-Entwicklungsumgebung untersuchen.

Lektion 2: Grundlegende Datenstrukturen in R

Erscheinungsdatum: März 30 2020

Links:

Video:

Beschreibung:
Diese Lektion hilft Ihnen zu verstehen, welche Datenstrukturen in der R-Sprache verfügbar sind. Wir werden uns im Detail mit Vektoren, Datumsrahmen und Listen befassen. Lassen Sie uns lernen, wie man sie erstellt und auf ihre einzelnen Elemente zugreift.

Lektion 3: Lesen von Daten aus TSV-, CSV-, Excel-Dateien und Google Sheets

Erscheinungsdatum: April 6 2020

Links:

Video:

Beschreibung:
Die Arbeit mit Daten beginnt unabhängig vom Tool mit der Extraktion. Pakete werden während des Unterrichts verwendet vroom, readxl, googlesheets4 zum Laden von Daten aus CSV-, TSV-, Excel-Dateien und Google Sheets in die R-Umgebung.

Lektion 4: Zeilen filtern, Spalten auswählen und umbenennen, Pipelines in R

Erscheinungsdatum: April 13 2020

Links:

Video:

Beschreibung:
In dieser Lektion geht es um das Paket dplyr. Darin erfahren Sie, wie Sie Datenrahmen filtern, die erforderlichen Spalten auswählen und umbenennen.

Außerdem erfahren Sie, was Pipelines sind und wie sie dazu beitragen, Ihren R-Code besser lesbar zu machen.

Lektion 5: Berechnete Spalten zu einer Tabelle in R hinzufügen

Erscheinungsdatum: April 20 2020

Links:

Video:

Beschreibung:
In diesem Video setzen wir unsere Bekanntschaft mit der Bibliothek fort tidyverse und Paket dplyr.
Schauen wir uns die Funktionsfamilie an mutate(), und wir werden lernen, wie man sie verwendet, um der Tabelle neue berechnete Spalten hinzuzufügen.

Lektion 6: Gruppieren und Aggregieren von Daten in R

Erscheinungsdatum: April 27 2020

Links:

Video:

Beschreibung:
Diese Lektion ist einer der Hauptoperationen der Datenanalyse, -gruppierung und -aggregation gewidmet. Während des Unterrichts werden wir das Paket verwenden dplyr und Funktionen group_by() и summarise().

Wir werden uns die gesamte Funktionsfamilie ansehen summarise()Dh summarise(), summarise_if() и summarise_at().

Lektion 7: Vertikale und horizontale Verbindung von Tabellen in R

Erscheinungsdatum: 4 Mai 2020

Links:

Video:

Beschreibung:
Diese Lektion wird Ihnen helfen, die Vorgänge beim vertikalen und horizontalen Verbinden von Tabellen zu verstehen.

Eine vertikale Union ist das Äquivalent der UNION-Operation in der SQL-Abfragesprache.

Der horizontale Join ist Excel-Benutzern dank der VLOOKUP-Funktion besser bekannt; in SQL werden solche Operationen vom JOIN-Operator ausgeführt.

Während der Lektion werden wir ein praktisches Problem lösen, bei dem wir Pakete verwenden dplyr, readxl, tidyr и stringr.

Die Hauptfunktionen, die wir betrachten werden:

  • bind_rows() - Vertikale Verbindung von Tischen
  • left_join() — horizontale Verbindung von Tischen
  • semi_join() - einschließlich Zusammenfügen von Tischen
  • anti_join() - Exklusiver Tischbeitritt

Lektion 8: Fensterfunktionen in R

Erscheinungsdatum: 11 Mai 2020

Links:

Beschreibung:
Fensterfunktionen haben eine ähnliche Bedeutung wie aggregierende; sie nehmen ebenfalls ein Array von Werten als Eingabe und führen arithmetische Operationen mit ihnen durch, ändern jedoch nicht die Anzahl der Zeilen im Ausgabeergebnis.

In diesem Tutorial studieren wir das Paket weiter dplyr, und Funktionen group_by(), mutate(), sowie neu cumsum(), lag(), lead() и arrange().

Lektion 9: Rotierende Tabellen oder ein Analogon von Pivot-Tabellen in R

Erscheinungsdatum: 18 Mai 2020

Links:

Beschreibung:
Die meisten Excel-Benutzer verwenden Pivot-Tabellen. Hierbei handelt es sich um ein praktisches Tool, mit dem Sie eine Reihe von Rohdaten in Sekundenschnelle in lesbare Berichte umwandeln können.

In diesem Tutorial schauen wir uns an, wie man Tabellen in R dreht und sie vom Breit- ins Langformat und umgekehrt konvertiert.

Der größte Teil der Lektion ist dem Paket gewidmet tidyr und Funktionen pivot_longer() и pivot_wider().

Lektion 10: JSON-Dateien in R laden und Listen in Tabellen konvertieren

Erscheinungsdatum: 25 Mai 2020

Links:

Beschreibung:
JSON und XML sind aufgrund ihrer Kompaktheit äußerst beliebte Formate zum Speichern und Austauschen von Informationen.

Es ist jedoch schwierig, in solchen Formaten dargestellte Daten zu analysieren. Daher ist es vor der Analyse notwendig, sie in tabellarischer Form zu bringen, und genau das werden wir in diesem Video lernen.

Die Lektion ist dem Paket gewidmet tidyr, im Kern der Bibliothek enthalten tidyverse, und Funktionen unnest_longer(), unnest_wider() и hoist().

Lektion 11: Schnelles Plotten mit der Funktion qplot()

Erscheinungsdatum: 1 2020 Juni

Links:

Beschreibung:
Package ggplot2 ist eines der beliebtesten Datenvisualisierungstools nicht nur in R.

In dieser Lektion lernen wir, wie man mit der Funktion einfache Diagramme erstellt qplot(), und analysieren wir alle ihre Argumente.

Lektion 12: Schichtweises Plotten mit dem Paket ggplot2

Erscheinungsdatum: 8 2020 Juni

Links:

Beschreibung:
Die Lektion demonstriert die volle Leistungsfähigkeit des Pakets ggplot2 und die Grammatik des Aufbaus von Graphen in darin eingebetteten Schichten.

Wir analysieren die Hauptgeometrien, die im Paket vorhanden sind, und lernen, wie man Schichten anwendet, um ein Diagramm zu erstellen.

Abschluss

Ich habe versucht, die Gestaltung des Kursprogramms so prägnant wie möglich anzugehen und nur die notwendigsten Informationen hervorzuheben, die Sie benötigen, um die ersten Schritte beim Erlernen eines so leistungsstarken Datenanalysetools wie der R-Sprache zu unternehmen.

Der Kurs ist keine erschöpfende Anleitung zur Datenanalyse mit der R-Sprache, aber er hilft Ihnen, alle dafür notwendigen Techniken zu verstehen.

Während das Kursprogramm auf 12 Wochen ausgelegt ist, öffne ich jede Woche montags den Zugang zu neuen Lektionen, was ich empfehle Zeichnen auf dem YouTube-Kanal, um die Veröffentlichung einer neuen Lektion nicht zu verpassen.

Source: habr.com

Kommentar hinzufügen