Ngôn ngữ R cho người dùng Excel (khóa học video miễn phí)

Do bị cách ly, nhiều người hiện dành phần lớn thời gian ở nhà và khoảng thời gian này có thể và thậm chí nên được sử dụng một cách hữu ích.

Khi bắt đầu cách ly, tôi quyết định hoàn thành một số dự án mà tôi đã bắt đầu vài tháng trước. Một trong những dự án này là khóa học video “Ngôn ngữ R dành cho người dùng Excel”. Với khóa học này, tôi muốn hạ thấp rào cản gia nhập R và giải quyết phần nào tình trạng thiếu tài liệu đào tạo hiện có về chủ đề này bằng tiếng Nga.

Nếu tất cả công việc với dữ liệu trong công ty mà bạn làm việc vẫn được thực hiện trong Excel, thì tôi khuyên bạn nên làm quen với một công cụ phân tích dữ liệu hiện đại hơn, đồng thời hoàn toàn miễn phí.

Ngôn ngữ R cho người dùng Excel (khóa học video miễn phí)

nội dung

Nếu bạn quan tâm đến phân tích dữ liệu, bạn có thể quan tâm đến tôi điện tín и youtube kênh truyền hình. Hầu hết nội dung được dành cho ngôn ngữ R.

  1. tài liệu tham khảo
  2. Về khóa học
  3. Khóa học này dành cho ai?
  4. chương trình khóa học
    4.1. Bài 1: Cài đặt ngôn ngữ R và môi trường phát triển RStudio
    4.2. Bài 2: Cấu trúc dữ liệu cơ bản trong R
    4.3. Bài 3: Đọc dữ liệu từ file TSV, CSV, Excel và Google Sheets
    4.4. Bài 4: Lọc hàng, chọn và đổi tên cột, pipe trong R
    4.5. Bài 5: Thêm các cột được tính toán vào bảng trong R
    4.6. Bài 6: Nhóm và tổng hợp dữ liệu trong R
    4.7. Bài 7: Nối các bảng theo chiều dọc và ngang trong R
    4.8. Bài 8: Hàm cửa sổ trong R
    4.9. Bài 9: Bảng xoay hoặc tương tự của bảng trụ trong R
    4.10. Bài 10: Load file JSON trong R và chuyển đổi danh sách thành bảng
    4.11. Bài 11: Vẽ đồ thị nhanh bằng hàm qplot()
    4.12. Bài 12: Vẽ đồ thị từng lớp bằng gói ggplot2
  5. Kết luận

tài liệu tham khảo

Về khóa học

Khóa học được cấu trúc xung quanh kiến ​​trúc tidyversevà các gói có trong đó: readr, vroom, dplyr, tidyr, ggplot2. Tất nhiên, có những gói tốt khác trong R thực hiện các hoạt động tương tự, chẳng hạn data.table, nhưng cú pháp tidyverse trực quan, dễ đọc ngay cả đối với người dùng chưa qua đào tạo, vì vậy tôi nghĩ sẽ tốt hơn nếu bắt đầu học ngôn ngữ R với tidyverse.

Khóa học sẽ hướng dẫn bạn thực hiện tất cả các thao tác phân tích dữ liệu, từ tải đến hiển thị kết quả hoàn thiện.

Tại sao lại là R mà không phải Python? Vì R là ngôn ngữ chức năng nên người dùng Excel sẽ dễ dàng chuyển sang ngôn ngữ này hơn vì không cần phải đi sâu vào lập trình hướng đối tượng truyền thống.

Hiện tại, 12 bài học video đã được lên kế hoạch, mỗi bài kéo dài từ 5 đến 20 phút.

Các bài học sẽ mở ra dần dần. Thứ Hai hàng tuần, tôi sẽ mở quyền truy cập vào một bài học mới trên trang web của mình. Kênh Youtube trong một danh sách phát riêng biệt.

Khóa học này dành cho ai?

Tôi nghĩ điều này đã rõ ràng ngay từ tiêu đề, tuy nhiên, tôi sẽ mô tả nó chi tiết hơn.

Khóa học hướng đến những người tích cực sử dụng Microsoft Excel trong công việc và thực hiện mọi công việc của họ với dữ liệu ở đó. Nhìn chung, nếu bạn mở ứng dụng Microsoft Excel ít nhất một lần một tuần thì khóa học này sẽ phù hợp với bạn.

Bạn không bắt buộc phải có kỹ năng lập trình để hoàn thành khóa học, bởi vì... Khóa học nhằm vào người mới bắt đầu.

Nhưng có lẽ bắt đầu từ bài 4 sẽ có tài liệu thú vị dành cho người dùng R tích cực, bởi vì... chức năng chính của các gói như dplyr и tidyr sẽ được thảo luận chi tiết.

chương trình khóa học

Bài 1: Cài đặt ngôn ngữ R và môi trường phát triển RStudio

Ngày công bố: Diễu 23 2020

Links:

Video:

Mô tả:
Bài học giới thiệu trong đó chúng ta sẽ tải xuống và cài đặt phần mềm cần thiết, đồng thời xem xét ngắn gọn các khả năng và giao diện của môi trường phát triển RStudio.

Bài 2: Cấu trúc dữ liệu cơ bản trong R

Ngày công bố: Diễu 30 2020

Links:

Video:

Mô tả:
Bài học này sẽ giúp bạn hiểu những cấu trúc dữ liệu nào có sẵn trong ngôn ngữ R. Chúng ta sẽ xem xét chi tiết về vectơ, khung ngày và danh sách. Hãy tìm hiểu cách tạo chúng và truy cập các phần tử riêng lẻ của chúng.

Bài 3: Đọc dữ liệu từ file TSV, CSV, Excel và Google Sheets

Ngày công bố: Tháng Tư 6 2020

Links:

Video:

Mô tả:
Làm việc với dữ liệu, bất kể công cụ nào, đều bắt đầu bằng việc trích xuất dữ liệu. Các gói được sử dụng trong buổi học vroom, readxl, googlesheets4 để tải dữ liệu vào môi trường R từ các tệp csv, tsv, Excel và Google Trang tính.

Bài 4: Lọc hàng, chọn và đổi tên cột, pipe trong R

Ngày công bố: Tháng Tư 13 2020

Links:

Video:

Mô tả:
Bài học này nói về gói dplyr. Trong đó, chúng ta sẽ tìm ra cách lọc các khung dữ liệu, chọn các cột cần thiết và đổi tên chúng.

Chúng ta cũng sẽ tìm hiểu quy trình là gì và cách chúng giúp mã R của bạn dễ đọc hơn.

Bài 5: Thêm các cột được tính toán vào bảng trong R

Ngày công bố: Tháng Tư 20 2020

Links:

Video:

Mô tả:
Trong video này chúng ta tiếp tục làm quen với thư viện tidyverse và gói dplyr.
Chúng ta hãy nhìn vào nhóm chức năng mutate()và chúng ta sẽ tìm hiểu cách sử dụng chúng để thêm các cột được tính toán mới vào bảng.

Bài 6: Nhóm và tổng hợp dữ liệu trong R

Ngày công bố: Tháng Tư 27 2020

Links:

Video:

Mô tả:
Bài học này được dành cho một trong những hoạt động chính của phân tích, nhóm và tổng hợp dữ liệu. Trong bài học chúng ta sẽ sử dụng gói dplyr và các tính năng group_by() и summarise().

Chúng ta sẽ xem xét toàn bộ nhóm hàm summarise()Tức là summarise(), summarise_if() и summarise_at().

Bài 7: Nối các bảng theo chiều dọc và ngang trong R

Ngày công bố: Có thể 4 2020

Links:

Video:

Mô tả:
Bài học này sẽ giúp các bạn hiểu rõ hơn về thao tác nối các bảng theo chiều dọc và chiều ngang.

Liên kết dọc tương đương với thao tác UNION trong ngôn ngữ truy vấn SQL.

Phép nối ngang được người dùng Excel biết đến nhiều hơn nhờ hàm VLOOKUP; trong SQL, các thao tác như vậy được thực hiện bởi toán tử THAM GIA.

Trong bài học, chúng ta sẽ giải quyết một vấn đề thực tế trong đó chúng ta sẽ sử dụng các gói dplyr, readxl, tidyr и stringr.

Các chức năng chính mà chúng tôi sẽ xem xét:

  • bind_rows() - nối theo chiều dọc của các bảng
  • left_join() - nối ngang các bảng
  • semi_join() - bao gồm cả việc nối các bảng
  • anti_join() - tham gia bảng độc quyền

Bài 8: Hàm cửa sổ trong R

Ngày công bố: Có thể 11 2020

Links:

Mô tả:
Các hàm cửa sổ có ý nghĩa tương tự như các hàm tổng hợp; chúng cũng lấy một mảng các giá trị làm đầu vào và thực hiện các phép tính số học trên chúng, nhưng không thay đổi số hàng trong kết quả đầu ra.

Trong hướng dẫn này chúng ta tiếp tục nghiên cứu gói dplyr, và các hàm group_by(), mutate(), cũng như mới cumsum(), lag(), lead() и arrange().

Bài 9: Bảng xoay hoặc tương tự của bảng trụ trong R

Ngày công bố: Có thể 18 2020

Links:

Mô tả:
Hầu hết người dùng Excel đều sử dụng bảng tổng hợp; đây là một công cụ tiện lợi giúp bạn có thể biến một mảng dữ liệu thô thành báo cáo có thể đọc được chỉ trong vài giây.

Trong hướng dẫn này, chúng ta sẽ xem cách xoay bảng trong R và chuyển đổi chúng từ định dạng rộng sang dài và ngược lại.

Phần lớn thời lượng bài học được dành riêng cho gói tidyr và chức năng pivot_longer() и pivot_wider().

Bài 10: Load file JSON trong R và chuyển đổi danh sách thành bảng

Ngày công bố: Có thể 25 2020

Links:

Mô tả:
JSON và XML là các định dạng cực kỳ phổ biến để lưu trữ và trao đổi thông tin, thường là do tính nhỏ gọn của chúng.

Nhưng rất khó để phân tích dữ liệu được trình bày ở các định dạng như vậy, vì vậy trước khi phân tích cần phải đưa dữ liệu đó sang dạng bảng, đó chính xác là những gì chúng ta sẽ tìm hiểu trong video này.

Bài học được dành riêng cho gói tidyr, được bao gồm trong lõi của thư viện tidyverse, và các hàm unnest_longer(), unnest_wider() и hoist().

Bài 11: Vẽ đồ thị nhanh bằng hàm qplot()

Ngày công bố: Tháng Sáu 1 2020

Links:

Mô tả:
Gói ggplot2 là một trong những công cụ trực quan hóa dữ liệu phổ biến nhất không chỉ ở R.

Trong bài học này chúng ta sẽ học cách vẽ đồ thị đơn giản bằng hàm qplot(), và hãy phân tích tất cả các lập luận của cô ấy.

Bài 12: Vẽ đồ thị từng lớp bằng gói ggplot2

Ngày công bố: Tháng Sáu 8 2020

Links:

Mô tả:
Bài học thể hiện toàn bộ sức mạnh của gói ggplot2 và ngữ pháp xây dựng đồ thị theo các lớp được nhúng trong đó.

Chúng tôi sẽ phân tích các dạng hình học chính có trong gói và tìm hiểu cách áp dụng các lớp để xây dựng biểu đồ.

Kết luận

Tôi đã cố gắng tiếp cận việc hình thành chương trình khóa học một cách ngắn gọn nhất có thể, chỉ nêu bật những thông tin cần thiết nhất mà bạn cần để thực hiện những bước đầu tiên trong việc học một công cụ phân tích dữ liệu mạnh mẽ như ngôn ngữ R.

Khóa học không phải là hướng dẫn đầy đủ về phân tích dữ liệu bằng ngôn ngữ R, nhưng nó sẽ giúp bạn hiểu tất cả các kỹ thuật cần thiết cho việc này.

Mặc dù chương trình khóa học được thiết kế trong 12 tuần nhưng vào thứ Hai hàng tuần, tôi sẽ mở quyền truy cập vào các bài học mới, vì vậy tôi khuyên bạn nên đăng ký trên kênh YouTube để không bỏ lỡ việc đăng bài học mới.

Nguồn: www.habr.com

Thêm một lời nhận xét