Prohoster > Blog > quản lý > Ngôn ngữ R cho người dùng Excel (khóa học video miễn phí)
Ngôn ngữ R cho người dùng Excel (khóa học video miễn phí)
Do bị cách ly, nhiều người hiện dành phần lớn thời gian ở nhà và khoảng thời gian này có thể và thậm chí nên được sử dụng một cách hữu ích.
Khi bắt đầu cách ly, tôi quyết định hoàn thành một số dự án mà tôi đã bắt đầu vài tháng trước. Một trong những dự án này là khóa học video “Ngôn ngữ R dành cho người dùng Excel”. Với khóa học này, tôi muốn hạ thấp rào cản gia nhập R và giải quyết phần nào tình trạng thiếu tài liệu đào tạo hiện có về chủ đề này bằng tiếng Nga.
Nếu tất cả công việc với dữ liệu trong công ty mà bạn làm việc vẫn được thực hiện trong Excel, thì tôi khuyên bạn nên làm quen với một công cụ phân tích dữ liệu hiện đại hơn, đồng thời hoàn toàn miễn phí.
nội dung
Nếu bạn quan tâm đến phân tích dữ liệu, bạn có thể quan tâm đến tôi điện tín и youtube kênh truyền hình. Hầu hết nội dung được dành cho ngôn ngữ R.
Khóa học được cấu trúc xung quanh kiến trúc tidyversevà các gói có trong đó: readr, vroom, dplyr, tidyr, ggplot2. Tất nhiên, có những gói tốt khác trong R thực hiện các hoạt động tương tự, chẳng hạn data.table, nhưng cú pháp tidyverse trực quan, dễ đọc ngay cả đối với người dùng chưa qua đào tạo, vì vậy tôi nghĩ sẽ tốt hơn nếu bắt đầu học ngôn ngữ R với tidyverse.
Khóa học sẽ hướng dẫn bạn thực hiện tất cả các thao tác phân tích dữ liệu, từ tải đến hiển thị kết quả hoàn thiện.
Tại sao lại là R mà không phải Python? Vì R là ngôn ngữ chức năng nên người dùng Excel sẽ dễ dàng chuyển sang ngôn ngữ này hơn vì không cần phải đi sâu vào lập trình hướng đối tượng truyền thống.
Hiện tại, 12 bài học video đã được lên kế hoạch, mỗi bài kéo dài từ 5 đến 20 phút.
Các bài học sẽ mở ra dần dần. Thứ Hai hàng tuần, tôi sẽ mở quyền truy cập vào một bài học mới trên trang web của mình. Kênh Youtube trong một danh sách phát riêng biệt.
Khóa học này dành cho ai?
Tôi nghĩ điều này đã rõ ràng ngay từ tiêu đề, tuy nhiên, tôi sẽ mô tả nó chi tiết hơn.
Khóa học hướng đến những người tích cực sử dụng Microsoft Excel trong công việc và thực hiện mọi công việc của họ với dữ liệu ở đó. Nhìn chung, nếu bạn mở ứng dụng Microsoft Excel ít nhất một lần một tuần thì khóa học này sẽ phù hợp với bạn.
Bạn không bắt buộc phải có kỹ năng lập trình để hoàn thành khóa học, bởi vì... Khóa học nhằm vào người mới bắt đầu.
Nhưng có lẽ bắt đầu từ bài 4 sẽ có tài liệu thú vị dành cho người dùng R tích cực, bởi vì... chức năng chính của các gói như dplyr и tidyr sẽ được thảo luận chi tiết.
chương trình khóa học
Bài 1: Cài đặt ngôn ngữ R và môi trường phát triển RStudio
Mô tả:
Bài học giới thiệu trong đó chúng ta sẽ tải xuống và cài đặt phần mềm cần thiết, đồng thời xem xét ngắn gọn các khả năng và giao diện của môi trường phát triển RStudio.
Mô tả:
Bài học này sẽ giúp bạn hiểu những cấu trúc dữ liệu nào có sẵn trong ngôn ngữ R. Chúng ta sẽ xem xét chi tiết về vectơ, khung ngày và danh sách. Hãy tìm hiểu cách tạo chúng và truy cập các phần tử riêng lẻ của chúng.
Bài 3: Đọc dữ liệu từ file TSV, CSV, Excel và Google Sheets
Mô tả:
Làm việc với dữ liệu, bất kể công cụ nào, đều bắt đầu bằng việc trích xuất dữ liệu. Các gói được sử dụng trong buổi học vroom, readxl, googlesheets4 để tải dữ liệu vào môi trường R từ các tệp csv, tsv, Excel và Google Trang tính.
Bài 4: Lọc hàng, chọn và đổi tên cột, pipe trong R
Mô tả:
Trong video này chúng ta tiếp tục làm quen với thư viện tidyverse và gói dplyr.
Chúng ta hãy nhìn vào nhóm chức năng mutate()và chúng ta sẽ tìm hiểu cách sử dụng chúng để thêm các cột được tính toán mới vào bảng.
Mô tả:
Bài học này được dành cho một trong những hoạt động chính của phân tích, nhóm và tổng hợp dữ liệu. Trong bài học chúng ta sẽ sử dụng gói dplyr và các tính năng group_by() и summarise().
Chúng ta sẽ xem xét toàn bộ nhóm hàm summarise()Tức là summarise(), summarise_if() и summarise_at().
Bài 7: Nối các bảng theo chiều dọc và ngang trong R
Mô tả:
Các hàm cửa sổ có ý nghĩa tương tự như các hàm tổng hợp; chúng cũng lấy một mảng các giá trị làm đầu vào và thực hiện các phép tính số học trên chúng, nhưng không thay đổi số hàng trong kết quả đầu ra.
Trong hướng dẫn này chúng ta tiếp tục nghiên cứu gói dplyr, và các hàm group_by(), mutate(), cũng như mới cumsum(), lag(), lead() и arrange().
Bài 9: Bảng xoay hoặc tương tự của bảng trụ trong R
Mô tả:
Hầu hết người dùng Excel đều sử dụng bảng tổng hợp; đây là một công cụ tiện lợi giúp bạn có thể biến một mảng dữ liệu thô thành báo cáo có thể đọc được chỉ trong vài giây.
Trong hướng dẫn này, chúng ta sẽ xem cách xoay bảng trong R và chuyển đổi chúng từ định dạng rộng sang dài và ngược lại.
Phần lớn thời lượng bài học được dành riêng cho gói tidyr và chức năng pivot_longer() и pivot_wider().
Bài 10: Load file JSON trong R và chuyển đổi danh sách thành bảng
Mô tả:
JSON và XML là các định dạng cực kỳ phổ biến để lưu trữ và trao đổi thông tin, thường là do tính nhỏ gọn của chúng.
Nhưng rất khó để phân tích dữ liệu được trình bày ở các định dạng như vậy, vì vậy trước khi phân tích cần phải đưa dữ liệu đó sang dạng bảng, đó chính xác là những gì chúng ta sẽ tìm hiểu trong video này.
Bài học được dành riêng cho gói tidyr, được bao gồm trong lõi của thư viện tidyverse, và các hàm unnest_longer(), unnest_wider() и hoist().
Mô tả:
Bài học thể hiện toàn bộ sức mạnh của gói ggplot2 và ngữ pháp xây dựng đồ thị theo các lớp được nhúng trong đó.
Chúng tôi sẽ phân tích các dạng hình học chính có trong gói và tìm hiểu cách áp dụng các lớp để xây dựng biểu đồ.
Kết luận
Tôi đã cố gắng tiếp cận việc hình thành chương trình khóa học một cách ngắn gọn nhất có thể, chỉ nêu bật những thông tin cần thiết nhất mà bạn cần để thực hiện những bước đầu tiên trong việc học một công cụ phân tích dữ liệu mạnh mẽ như ngôn ngữ R.
Khóa học không phải là hướng dẫn đầy đủ về phân tích dữ liệu bằng ngôn ngữ R, nhưng nó sẽ giúp bạn hiểu tất cả các kỹ thuật cần thiết cho việc này.
Mặc dù chương trình khóa học được thiết kế trong 12 tuần nhưng vào thứ Hai hàng tuần, tôi sẽ mở quyền truy cập vào các bài học mới, vì vậy tôi khuyên bạn nên đăng ký trên kênh YouTube để không bỏ lỡ việc đăng bài học mới.