Γλώσσα R για χρήστες του Excel (δωρεάν μάθημα βίντεο)

Λόγω της καραντίνας, πολλοί περνούν πλέον τη μερίδα του λέοντος του χρόνου τους στο σπίτι και αυτός ο χρόνος μπορεί, ακόμη και πρέπει, να τον ξοδέψουν χρήσιμα.

Στην αρχή της καραντίνας, αποφάσισα να ολοκληρώσω κάποια έργα που ξεκίνησα πριν λίγους μήνες. Ένα από αυτά τα έργα ήταν το μάθημα βίντεο «R Language for Excel Users». Με αυτό το μάθημα, ήθελα να μειώσω το εμπόδιο για την είσοδο στο R και να καλύψω ελαφρώς την υπάρχουσα έλλειψη εκπαιδευτικού υλικού για αυτό το θέμα στα ρωσικά.

Εάν όλη η εργασία με δεδομένα στην εταιρεία στην οποία εργάζεστε εξακολουθεί να γίνεται στο Excel, τότε σας προτείνω να εξοικειωθείτε με ένα πιο σύγχρονο, και ταυτόχρονα εντελώς δωρεάν, εργαλείο ανάλυσης δεδομένων.

Γλώσσα R για χρήστες του Excel (δωρεάν μάθημα βίντεο)

περιεχόμενο

Εάν ενδιαφέρεστε για την ανάλυση δεδομένων, μπορεί να σας ενδιαφέρει το δικό μου τηλεγράφημα и YouTube καναλιών. Το μεγαλύτερο μέρος του περιεχομένου του οποίου είναι αφιερωμένο στη γλώσσα R.

  1. παραπομπές
  2. Σχετικά με το μάθημα
  3. Σε ποιους απευθύνεται αυτό το μάθημα;
  4. Πρόγραμμα μαθημάτων
    4.1. Μάθημα 1: Εγκατάσταση της γλώσσας R και του περιβάλλοντος ανάπτυξης RStudio
    4.2. Μάθημα 2: Βασικές δομές δεδομένων στο R
    4.3. Μάθημα 3: Ανάγνωση δεδομένων από αρχεία TSV, CSV, Excel και Φύλλα Google
    4.4. Μάθημα 4: Φιλτράρισμα σειρών, επιλογή και μετονομασία στηλών, αγωγών στο R
    4.5. Μάθημα 5: Προσθήκη υπολογιζόμενων στηλών σε έναν πίνακα στο R
    4.6. Μάθημα 6: Ομαδοποίηση και συγκέντρωση δεδομένων στο R
    4.7. Μάθημα 7: Κάθετη και οριζόντια ένωση πινάκων στο R
    4.8. Μάθημα 8: Συναρτήσεις παραθύρου στο R
    4.9. Μάθημα 9: Περιστρεφόμενοι πίνακες ή ανάλογο συγκεντρωτικών πινάκων στο R
    4.10. Μάθημα 10: Φόρτωση αρχείων JSON στο R και μετατροπή λιστών σε πίνακες
    4.11. Μάθημα 11: Γρήγορη γραφική παράσταση με χρήση της συνάρτησης qplot().
    4.12. Μάθημα 12: Σχεδίαση διαγραμμάτων στρώσης προς στρώση χρησιμοποιώντας το πακέτο ggplot2
  5. Συμπέρασμα

παραπομπές

Σχετικά με το μάθημα

Το μάθημα δομείται γύρω από την αρχιτεκτονική tidyverseκαι τα πακέτα που περιλαμβάνονται σε αυτό: readr, vroom, dplyr, tidyr, ggplot2. Φυσικά, υπάρχουν και άλλα καλά πακέτα στο R που εκτελούν παρόμοιες λειτουργίες, για παράδειγμα data.table, αλλά η σύνταξη tidyverse διαισθητικό, ευανάγνωστο ακόμη και για έναν μη εκπαιδευμένο χρήστη, οπότε νομίζω ότι είναι καλύτερο να αρχίσετε να μαθαίνετε τη γλώσσα R με tidyverse.

Το μάθημα θα σας καθοδηγήσει σε όλες τις λειτουργίες ανάλυσης δεδομένων, από τη φόρτωση έως την οπτικοποίηση του τελικού αποτελέσματος.

Γιατί R και όχι Python; Επειδή η R είναι μια λειτουργική γλώσσα, είναι ευκολότερο για τους χρήστες του Excel να μεταβούν σε αυτήν, επειδή δεν χρειάζεται να εμβαθύνουμε στον παραδοσιακό αντικειμενοστραφή προγραμματισμό.

Αυτή τη στιγμή έχουν προγραμματιστεί 12 βιντεομαθήματα διάρκειας από 5 έως 20 λεπτά το καθένα.

Τα μαθήματα θα ανοίξουν σταδιακά. Κάθε Δευτέρα θα ανοίγω πρόσβαση σε ένα νέο μάθημα στον ιστότοπό μου. Κανάλι YouTube σε ξεχωριστή λίστα αναπαραγωγής.

Σε ποιους απευθύνεται αυτό το μάθημα;

Νομίζω ότι αυτό φαίνεται ξεκάθαρα από τον τίτλο, ωστόσο, θα το περιγράψω πιο αναλυτικά.

Το μάθημα απευθύνεται σε όσους χρησιμοποιούν ενεργά το Microsoft Excel στην εργασία τους και υλοποιούν όλη τους την εργασία με δεδομένα εκεί. Γενικά, αν ανοίγετε την εφαρμογή Microsoft Excel τουλάχιστον μία φορά την εβδομάδα, τότε το μάθημα είναι κατάλληλο για εσάς.

Δεν απαιτείται να έχετε δεξιότητες προγραμματισμού για να ολοκληρώσετε το μάθημα, επειδή... Το μάθημα απευθύνεται σε αρχάριους.

Αλλά, ίσως, ξεκινώντας από το μάθημα 4, θα υπάρχει ενδιαφέρον υλικό και για ενεργούς χρήστες R, γιατί... η κύρια λειτουργικότητα τέτοιων πακέτων όπως dplyr и tidyr θα συζητηθεί με κάποια λεπτομέρεια.

Πρόγραμμα μαθημάτων

Μάθημα 1: Εγκατάσταση της γλώσσας R και του περιβάλλοντος ανάπτυξης RStudio

Ημερομηνία δημοσίευσης της πρόσκλησης: Μαρτίου 23 2020

Βιβλιογραφικές αναφορές:

Βίντεο:

Περιγραφή:
Ένα εισαγωγικό μάθημα κατά το οποίο θα κατεβάσουμε και θα εγκαταστήσουμε το απαραίτητο λογισμικό και θα εξετάσουμε εν συντομία τις δυνατότητες και τη διεπαφή του περιβάλλοντος ανάπτυξης RStudio.

Μάθημα 2: Βασικές δομές δεδομένων στο R

Ημερομηνία δημοσίευσης της πρόσκλησης: Μαρτίου 30 2020

Βιβλιογραφικές αναφορές:

Βίντεο:

Περιγραφή:
Αυτό το μάθημα θα σας βοηθήσει να κατανοήσετε ποιες δομές δεδομένων είναι διαθέσιμες στη γλώσσα R. Θα εξετάσουμε λεπτομερώς διανύσματα, πλαίσια ημερομηνιών και λίστες. Ας μάθουμε πώς να τα δημιουργήσουμε και να αποκτήσουμε πρόσβαση στα επιμέρους στοιχεία τους.

Μάθημα 3: Ανάγνωση δεδομένων από αρχεία TSV, CSV, Excel και Φύλλα Google

Ημερομηνία δημοσίευσης της πρόσκλησης: Απρίλιος 6 2020

Βιβλιογραφικές αναφορές:

Βίντεο:

Περιγραφή:
Η εργασία με δεδομένα, ανεξάρτητα από το εργαλείο, ξεκινά με την εξαγωγή τους. Κατά τη διάρκεια του μαθήματος χρησιμοποιούνται πακέτα vroom, readxl, googlesheets4 για τη φόρτωση δεδομένων στο περιβάλλον R από αρχεία csv, tsv, Excel και Φύλλα Google.

Μάθημα 4: Φιλτράρισμα σειρών, επιλογή και μετονομασία στηλών, αγωγών στο R

Ημερομηνία δημοσίευσης της πρόσκλησης: Απρίλιος 13 2020

Βιβλιογραφικές αναφορές:

Βίντεο:

Περιγραφή:
Αυτό το μάθημα αφορά το πακέτο dplyr. Σε αυτό θα καταλάβουμε πώς να φιλτράρουμε πλαίσια δεδομένων, να επιλέξουμε τις απαραίτητες στήλες και να τις μετονομάσουμε.

Θα μάθουμε επίσης τι είναι οι αγωγοί και πώς βοηθούν να γίνει ο κώδικας R σας πιο ευανάγνωστος.

Μάθημα 5: Προσθήκη υπολογιζόμενων στηλών σε έναν πίνακα στο R

Ημερομηνία δημοσίευσης της πρόσκλησης: Απρίλιος 20 2020

Βιβλιογραφικές αναφορές:

Βίντεο:

Περιγραφή:
Σε αυτό το βίντεο συνεχίζουμε τη γνωριμία μας με τη βιβλιοθήκη tidyverse και πακέτο dplyr.
Ας δούμε την οικογένεια των λειτουργιών mutate(), και θα μάθουμε πώς να τις χρησιμοποιούμε για να προσθέσουμε νέες υπολογισμένες στήλες στον πίνακα.

Μάθημα 6: Ομαδοποίηση και συγκέντρωση δεδομένων στο R

Ημερομηνία δημοσίευσης της πρόσκλησης: Απρίλιος 27 2020

Βιβλιογραφικές αναφορές:

Βίντεο:

Περιγραφή:
Αυτό το μάθημα είναι αφιερωμένο σε μία από τις κύριες λειτουργίες της ανάλυσης δεδομένων, της ομαδοποίησης και της συγκέντρωσης. Κατά τη διάρκεια του μαθήματος θα χρησιμοποιήσουμε το πακέτο dplyr και λειτουργίες group_by() и summarise().

Θα εξετάσουμε ολόκληρη την οικογένεια των λειτουργιών summarise(), δηλ. summarise(), summarise_if() и summarise_at().

Μάθημα 7: Κάθετη και οριζόντια ένωση πινάκων στο R

Ημερομηνία δημοσίευσης της πρόσκλησης: May 4 2020

Βιβλιογραφικές αναφορές:

Βίντεο:

Περιγραφή:
Αυτό το μάθημα θα σας βοηθήσει να κατανοήσετε τις λειτουργίες κάθετης και οριζόντιας ένωσης πινάκων.

Μια κατακόρυφη ένωση είναι το ισοδύναμο της λειτουργίας UNION στη γλώσσα ερωτημάτων SQL.

Η οριζόντια σύνδεση είναι πιο γνωστή στους χρήστες του Excel χάρη στη συνάρτηση VLOOKUP· στην SQL, τέτοιες λειτουργίες εκτελούνται από τον τελεστή JOIN.

Κατά τη διάρκεια του μαθήματος θα λύσουμε ένα πρακτικό πρόβλημα κατά το οποίο θα χρησιμοποιήσουμε πακέτα dplyr, readxl, tidyr и stringr.

Οι κύριες λειτουργίες που θα εξετάσουμε:

  • bind_rows() - κάθετη ένωση τραπεζιών
  • left_join() — οριζόντια ένωση τραπεζιών
  • semi_join() - συμπεριλαμβανομένης της ένωσης τραπεζιών
  • anti_join() - αποκλειστική συμμετοχή σε τραπέζι

Μάθημα 8: Συναρτήσεις παραθύρου στο R

Ημερομηνία δημοσίευσης της πρόσκλησης: May 11 2020

Βιβλιογραφικές αναφορές:

Περιγραφή:
Οι συναρτήσεις παραθύρου είναι παρόμοιες ως προς τη σημασία με αυτές που συγκεντρώνουν· λαμβάνουν επίσης μια σειρά τιμών ως είσοδο και εκτελούν αριθμητικές πράξεις σε αυτές, αλλά δεν αλλάζουν τον αριθμό των γραμμών στο αποτέλεσμα εξόδου.

Σε αυτό το σεμινάριο συνεχίζουμε να μελετάμε το πακέτο dplyrκαι λειτουργίες group_by(), mutate(), καθώς και νέα cumsum(), lag(), lead() и arrange().

Μάθημα 9: Περιστρεφόμενοι πίνακες ή ανάλογο συγκεντρωτικών πινάκων στο R

Ημερομηνία δημοσίευσης της πρόσκλησης: May 18 2020

Βιβλιογραφικές αναφορές:

Περιγραφή:
Οι περισσότεροι χρήστες του Excel χρησιμοποιούν συγκεντρωτικούς πίνακες· αυτό είναι ένα βολικό εργαλείο με το οποίο μπορείτε να μετατρέψετε μια σειρά ακατέργαστων δεδομένων σε αναγνώσιμες αναφορές μέσα σε λίγα δευτερόλεπτα.

Σε αυτό το σεμινάριο θα δούμε πώς να περιστρέφουμε πίνακες σε R και να τους μετατρέπουμε από ευρεία σε μεγάλη μορφή και αντίστροφα.

Το μεγαλύτερο μέρος του μαθήματος είναι αφιερωμένο στο πακέτο tidyr και λειτουργίες pivot_longer() и pivot_wider().

Μάθημα 10: Φόρτωση αρχείων JSON στο R και μετατροπή λιστών σε πίνακες

Ημερομηνία δημοσίευσης της πρόσκλησης: May 25 2020

Βιβλιογραφικές αναφορές:

Περιγραφή:
Το JSON και το XML είναι εξαιρετικά δημοφιλείς μορφές για την αποθήκευση και την ανταλλαγή πληροφοριών, συνήθως λόγω της συμπαγούς τους.

Αλλά είναι δύσκολο να αναλυθούν δεδομένα που παρουσιάζονται σε τέτοιες μορφές, επομένως πριν από την ανάλυση είναι απαραίτητο να τα φέρουμε σε μορφή πίνακα, κάτι που ακριβώς θα μάθουμε σε αυτό το βίντεο.

Το μάθημα είναι αφιερωμένο στο πακέτο tidyr, που περιλαμβάνεται στον πυρήνα της βιβλιοθήκης tidyverseκαι λειτουργίες unnest_longer(), unnest_wider() и hoist().

Μάθημα 11: Γρήγορη γραφική παράσταση με χρήση της συνάρτησης qplot().

Ημερομηνία δημοσίευσης της πρόσκλησης: Ιούνιος 1 2020

Βιβλιογραφικές αναφορές:

Περιγραφή:
Πακέτο ggplot2 είναι ένα από τα πιο δημοφιλή εργαλεία οπτικοποίησης δεδομένων όχι μόνο στο R.

Σε αυτό το μάθημα θα μάθουμε πώς να χτίζουμε απλά γραφήματα χρησιμοποιώντας τη συνάρτηση qplot(), και ας αναλύσουμε όλα τα επιχειρήματά της.

Μάθημα 12: Σχεδίαση διαγραμμάτων στρώσης προς στρώση χρησιμοποιώντας το πακέτο ggplot2

Ημερομηνία δημοσίευσης της πρόσκλησης: Ιούνιος 8 2020

Βιβλιογραφικές αναφορές:

Περιγραφή:
Το μάθημα δείχνει την πλήρη ισχύ του πακέτου ggplot2 και τη γραμματική της κατασκευής γραφημάτων σε στρώματα που είναι ενσωματωμένα σε αυτό.

Θα αναλύσουμε τις κύριες γεωμετρίες που υπάρχουν στο πακέτο και θα μάθουμε πώς να εφαρμόζουμε επίπεδα για να δημιουργήσουμε ένα γράφημα.

Συμπέρασμα

Προσπάθησα να προσεγγίσω τη διαμόρφωση του προγράμματος μαθημάτων όσο το δυνατόν συνοπτικά, για να επισημάνω μόνο τις πιο απαραίτητες πληροφορίες που θα χρειαστείτε για να κάνετε τα πρώτα βήματα στην εκμάθηση ενός τόσο ισχυρού εργαλείου ανάλυσης δεδομένων όπως η γλώσσα R.

Το μάθημα δεν είναι ένας εξαντλητικός οδηγός ανάλυσης δεδομένων χρησιμοποιώντας τη γλώσσα R, αλλά θα σας βοηθήσει να κατανοήσετε όλες τις απαραίτητες τεχνικές για αυτό.

Ενώ το πρόγραμμα μαθημάτων έχει σχεδιαστεί για 12 εβδομάδες, κάθε εβδομάδα τη Δευτέρα θα ανοίγω πρόσβαση σε νέα μαθήματα, γι' αυτό προτείνω εγγραφείτε στο κανάλι YouTube για να μην χάσετε τη δημοσίευση ενός νέου μαθήματος.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο