12 khóa học trực tuyến về Kỹ thuật dữ liệu

12 khóa học trực tuyến về Kỹ thuật dữ liệu
Theo Statista, đến năm 2025, quy mô của thị trường dữ liệu lớn sẽ tăng lên 175 zettabyte so với 41 vào năm 2019 (lịch trình). Để có được việc làm trong lĩnh vực này, bạn cần hiểu cách làm việc với dữ liệu lớn được lưu trữ trên đám mây. Cloud4Y đã tổng hợp danh sách 12 khóa học kỹ thuật dữ liệu miễn phí và trả phí sẽ mở rộng kiến ​​thức của bạn trong lĩnh vực này và có thể là điểm khởi đầu tốt trên con đường đạt được chứng chỉ đám mây của bạn.

lời tựa

Kỹ sư dữ liệu là gì? Đây là người chịu trách nhiệm tạo và duy trì kiến ​​trúc dữ liệu trong dự án Khoa học dữ liệu. Các trách nhiệm có thể bao gồm đảm bảo luồng dữ liệu thông suốt giữa máy chủ và ứng dụng, tích hợp phần mềm quản lý dữ liệu mới, cải thiện quy trình dữ liệu cơ bản và tạo đường dẫn dữ liệu.

Có rất nhiều công nghệ và công cụ mà kỹ sư dữ liệu phải thành thạo để làm việc với điện toán đám mây, kho dữ liệu, ETL (trích xuất, chuyển đổi, tải), v.v. Hơn nữa, số lượng kỹ năng cần thiết không ngừng tăng lên, vì vậy một kỹ sư dữ liệu cần thường xuyên bổ sung kiến ​​thức kiến ​​thức của mình. Danh sách của chúng tôi bao gồm các khóa học dành cho người mới bắt đầu và các chuyên gia có kinh nghiệm. Chọn những gì phù hợp với bạn.

1. Chứng nhận cấp độ nano kỹ thuật dữ liệu (Udacity)

Bạn sẽ học cách thiết kế mô hình dữ liệu, tạo kho dữ liệu và hồ dữ liệu, tự động hóa đường dẫn dữ liệu và làm việc với các mảng tập dữ liệu. Vào cuối chương trình, bạn sẽ kiểm tra các kỹ năng mới của mình bằng cách hoàn thành dự án Capstone.

Thời lượng: 5 tháng, 5 giờ mỗi tuần
Ngôn ngư: Tiếng Anh
Цена: $ 1695
Уровень: ban đầu

2. Trở thành Chứng chỉ Kỹ sư Dữ liệu (Coursera)

Họ dạy từ những điều cơ bản. Bạn có thể tiến bộ từng bước bằng cách sử dụng các bài giảng và dự án thực hành để rèn luyện kỹ năng của mình. Khi kết thúc khóa đào tạo, bạn sẽ sẵn sàng làm việc với ML và dữ liệu lớn. Nên biết Python ít nhất ở mức tối thiểu.

Thời lượng: 8 tháng, 10 giờ mỗi tuần
Ngôn ngư: Tiếng Anh
Цена😕
Уровень: ban đầu

3. Trở thành Kỹ sư dữ liệu: Nắm vững các khái niệm (LinkedIn Học)

Bạn sẽ phát triển kỹ năng kỹ thuật dữ liệu và DevOps, tìm hiểu cách tạo ứng dụng Dữ liệu lớn, tạo đường dẫn dữ liệu, xử lý ứng dụng trong thời gian thực bằng Hazelcast và cơ sở dữ liệu Hadoop.

Thời lượng: Phụ thuộc vào bạn
Ngôn ngư: Tiếng Anh
Цена: tháng đầu tiên - miễn phí
Уровень: ban đầu

4. Các khóa học kỹ thuật dữ liệu (EDX)

Đây là một loạt chương trình giới thiệu cho bạn về kỹ thuật dữ liệu và hướng dẫn bạn cách phát triển các giải pháp phân tích. Các khóa học được chia thành các danh mục dựa trên mức độ khó, vì vậy bạn có thể chọn một khóa học tùy theo mức độ kinh nghiệm của mình. Trong quá trình đào tạo, bạn sẽ học cách sử dụng Spark, Hadoop, Azure và quản lý dữ liệu của công ty.

Thời lượng: Phụ thuộc vào bạn
Ngôn ngư: Tiếng Anh
Цена: phụ thuộc vào khóa học đã chọn
Уровень: người mới bắt đầu, trung cấp, nâng cao

5. Kỹ sư dữ liệu (Truy vấn dữ liệu)

Khóa học này đáng tham gia nếu bạn có kinh nghiệm với Python và muốn nâng cao kiến ​​thức cũng như xây dựng sự nghiệp với tư cách là nhà khoa học dữ liệu. Bạn sẽ tìm hiểu cách xây dựng đường dẫn dữ liệu bằng Python và pandas, tải các tập dữ liệu lớn vào cơ sở dữ liệu Postgres sau khi làm sạch, chuyển đổi và xác thực.

Thời lượng: Phụ thuộc vào bạn
Ngôn ngư: Tiếng Anh
Цена: phụ thuộc vào hình thức đăng ký
Уровень: Người mới bắt đầu trung cấp

6. Kỹ thuật dữ liệu với Google Cloud (Coursera)

Khóa học này sẽ giúp bạn đạt được những kỹ năng cần thiết để xây dựng sự nghiệp trong lĩnh vực dữ liệu lớn. Ví dụ: làm việc với BigQuery, Spark. Bạn sẽ có được kiến ​​thức cần thiết để chuẩn bị cho chứng chỉ Kỹ sư dữ liệu chuyên nghiệp của Google Cloud được công nhận trong ngành.

Thời lượng: 4 tháng
Ngôn ngư: Tiếng Anh
Цена: miễn phí bây giờ
Уровень: Người mới bắt đầu trung cấp

7. Kỹ thuật dữ liệu, Dữ liệu lớn trên Google Cloud Platform (Coursera)

Một khóa học thú vị cung cấp kiến ​​thức thực tế về hệ thống xử lý dữ liệu trong GCP. Trong lớp học, bạn sẽ học cách thiết kế hệ thống trước khi bắt đầu quá trình phát triển. Ngoài ra, bạn cũng sẽ phân tích cả dữ liệu có cấu trúc và không cấu trúc, áp dụng tính năng tự động chia tỷ lệ và áp dụng các kỹ thuật ML để trích xuất thông tin.

Thời lượng: 3 tháng
Ngôn ngư: Tiếng Anh
Цена: miễn phí bây giờ
Уровень: Người mới bắt đầu trung cấp

8. UC San Diego: Chuyên môn về dữ liệu lớn (Coursera)

Khóa học dựa trên việc sử dụng khung Hadoop và Spark cũng như áp dụng các kỹ thuật dữ liệu lớn này vào quy trình ML. Bạn sẽ tìm hiểu những kiến ​​thức cơ bản về cách sử dụng Hadoop với MapReduce, Spark, Pig và Hive. Tìm hiểu cách xây dựng mô hình dự đoán và sử dụng phân tích biểu đồ để mô hình hóa các vấn đề. Xin lưu ý rằng khóa học này không yêu cầu bất kỳ kinh nghiệm lập trình nào.

Thời lượng: 8 tháng 10 giờ mỗi tuần
Ngôn ngư: Tiếng Anh
Цена: miễn phí bây giờ
Уровень: ban đầu

9. Thuần hóa dữ liệu lớn với Apache Spark và Python (Udemy)

Bạn sẽ tìm hiểu cách sử dụng cấu trúc luồng và khung dữ liệu trong Spark3, đồng thời hiểu cách sử dụng dịch vụ Elastic MapReduce của Amazon để hoạt động với cụm Hadoop của bạn. Tìm hiểu cách xác định các vấn đề trong phân tích dữ liệu lớn và hiểu cách thư viện GraphX ​​hoạt động với phân tích mạng cũng như cách bạn có thể sử dụng MLlib.

Thời lượng: Phụ thuộc vào bạn
Ngôn ngư: Tiếng Anh
Цена: từ 800 rúp đến $149,99 (tùy thuộc vào vận may của bạn)
Уровень: Người mới bắt đầu trung cấp

10. Chương trình PG về Kỹ thuật dữ liệu lớn (lên)

Khóa học này sẽ giúp bạn hiểu về cách Aadhaar hoạt động, cách Facebook cá nhân hóa nguồn cấp tin tức và cách Kỹ thuật dữ liệu có thể được sử dụng nói chung. Các chủ đề chính sẽ là xử lý dữ liệu (bao gồm xử lý thời gian thực), MapReduce, phân tích dữ liệu lớn.

Thời lượng: Bảy tháng
Ngôn ngư: Tiếng Anh
Цена: khoảng $3000
Уровень: ban đầu

11. Nghề nghiệp Nhà khoa học dữ liệu (Hộp kỹ năng)

Bạn sẽ học cách lập trình bằng Python, nghiên cứu các khuôn khổ để đào tạo mạng lưới thần kinh Tensorflow và Keras. Nắm vững cơ sở dữ liệu MongoDB, PostgreSQL, SQLite3, học cách làm việc với các thư viện Pandas, NumPy và Matpotlib.

Thời lượng: 300 giờ đào tạo
Ngôn ngư: Tiếng Nga
Цена: sáu tháng đầu miễn phí, sau đó là 3900 rúp mỗi tháng
Уровень: ban đầu

12. Kỹ sư dữ liệu 7.0 (Phòng thí nghiệm nghề nghiệp mới)

Bạn sẽ nhận được một nghiên cứu chuyên sâu về kiến ​​trúc Kafka, HDFS, ClickHouse, Spark, Airflow, lambda và kappa. Bạn sẽ học cách kết nối các công cụ với nhau, hình thành các quy trình, đạt được giải pháp cơ bản. Để học, cần có kiến ​​thức tối thiểu về Python 3.

Thời lượng: 21 bài học, 7 tuần
Ngôn ngư: Tiếng Nga
Цена: từ 60 đến 000 rúp
Уровень: ban đầu

Nếu bạn muốn thêm một khóa học hay khác vào danh sách, bạn có thể hủy đăng ký trong phần bình luận hoặc PM. Chúng tôi sẽ cập nhật bài viết.

Bạn có thể đọc gì khác trên blog? Đám mây4Y

Hình học của vũ trụ là gì?
Trứng Phục sinh trên bản đồ địa hình của Thụy Sĩ
Lịch sử đơn giản và rất ngắn gọn về sự phát triển của "đám mây"
Ngân hàng thất bại như thế nào?
Các thương hiệu máy tính của thập niên 90, phần 3, chung kết

Đăng ký của chúng tôi Telegram-channel để không bỏ lỡ bài viết tiếp theo. Chúng tôi viết không quá hai lần một tuần và chỉ viết về công việc. Chúng tôi cũng xin nhắc bạn rằng vào ngày 21 tháng 15 lúc 00:XNUMX (giờ Moscow), chúng tôi sẽ tổ chức hội thảo trên web về chủ đề “Bảo mật thông tin doanh nghiệp khi làm việc từ xa”. Nếu bạn muốn hiểu cách bảo vệ thông tin nhạy cảm và thông tin của công ty khi nhân viên làm việc tại nhà, hãy đăng ký!

Nguồn: www.habr.com

Thêm một lời nhận xét