เนื่องจากการกักตัว ทำให้หลายคนใช้เวลาอยู่ที่บ้านเป็นจำนวนมาก และเวลานี้สามารถทำได้และแม้กระทั่งควรจะใช้เวลาให้เกิดประโยชน์ด้วยซ้ำ
ในช่วงเริ่มต้นของการกักกัน ฉันตัดสินใจทำบางโปรเจ็กต์ที่เริ่มไว้เมื่อไม่กี่เดือนก่อนให้เสร็จ หนึ่งในโครงการเหล่านี้คือหลักสูตรวิดีโอ “ภาษา R สำหรับผู้ใช้ Excel” ด้วยหลักสูตรนี้ ฉันต้องการลดอุปสรรคในการเข้าสู่ R และเติมเต็มเนื้อหาการฝึกอบรมที่มีอยู่ในภาษารัสเซียในหัวข้อนี้ที่ขาดแคลนเล็กน้อย
หากทุกอย่างทำงานกับข้อมูลในบริษัทที่คุณทำงานด้วยใน Excel ฉันขอแนะนำให้คุณทำความคุ้นเคยกับเครื่องมือวิเคราะห์ข้อมูลที่ทันสมัยกว่าและในขณะเดียวกันก็ฟรีโดยสมบูรณ์
Содержание
หากคุณสนใจในการวิเคราะห์ข้อมูล คุณอาจสนใจใน my
การอ้างอิง เกี่ยวกับหลักสูตร หลักสูตรนี้เหมาะกับใครบ้าง? โปรแกรมหลักสูตร
4.1.บทที่ 1: การติดตั้งภาษา R และสภาพแวดล้อมการพัฒนา RStudio
4.2.บทที่ 2: โครงสร้างข้อมูลพื้นฐานใน R
4.3.บทที่ 3: การอ่านข้อมูลจากไฟล์ TSV, CSV, Excel และ Google ชีต
4.4.บทที่ 4: การกรองแถว การเลือกและเปลี่ยนชื่อคอลัมน์ ไปป์ไลน์ใน R
4.5.บทที่ 5: การเพิ่มคอลัมน์จากการคำนวณลงในตารางใน R
4.6.บทที่ 6: การจัดกลุ่มและการรวมข้อมูลใน R
4.7.บทที่ 7: การรวมตารางในแนวตั้งและแนวนอนใน R
4.8.บทที่ 8: ฟังก์ชั่นหน้าต่างใน R
4.9.บทที่ 9: การหมุนตารางหรืออะนาล็อกของตารางเดือยใน R
4.10.บทที่ 10: การโหลดไฟล์ JSON ใน R และการแปลงรายการเป็นตาราง
4.11.บทที่ 11: การวางแผนอย่างรวดเร็วโดยใช้ฟังก์ชัน qplot()
4.12.บทที่ 12: การลงจุดทีละชั้นโดยใช้แพ็คเกจ ggplot2 ข้อสรุป
การอ้างอิง
เกี่ยวกับหลักสูตร
หลักสูตรนี้เน้นสถาปัตยกรรมเป็นหลัก tidyverse
และแพ็คเกจที่รวมอยู่ในนั้น: readr
, vroom
, dplyr
, tidyr
, ggplot2
. แน่นอนว่ายังมีแพ็คเกจดีๆ อื่นๆ ใน R ที่ทำงานคล้ายกัน เป็นต้น data.table
แต่ไวยากรณ์ tidyverse
ใช้งานง่าย อ่านง่ายแม้สำหรับผู้ใช้ที่ไม่ผ่านการฝึกอบรม ดังนั้น ฉันคิดว่าเป็นการดีกว่าที่จะเริ่มเรียนรู้ภาษา R ด้วย tidyverse
.
หลักสูตรนี้จะแนะนำคุณตลอดการดำเนินการวิเคราะห์ข้อมูลทั้งหมด ตั้งแต่การโหลดไปจนถึงการแสดงภาพผลลัพธ์ที่เสร็จสมบูรณ์
ทำไมต้อง R ไม่ใช่ Python? เนื่องจาก R เป็นภาษาที่ใช้งานได้ ผู้ใช้ Excel จึงสามารถสลับไปใช้ภาษาดังกล่าวได้ง่ายกว่า เนื่องจาก ไม่จำเป็นต้องเจาะลึกการเขียนโปรแกรมเชิงวัตถุแบบดั้งเดิม
ในขณะนี้มีการวางแผนบทเรียนวิดีโอ 12 บทเรียน ครั้งละ 5 ถึง 20 นาที
บทเรียนจะค่อยๆเปิดขึ้น ทุกวันจันทร์ ฉันจะเปิดให้เข้าถึงบทเรียนใหม่บนเว็บไซต์ของฉัน
หลักสูตรนี้เหมาะกับใครบ้าง?
ฉันคิดว่าเรื่องนี้ชัดเจนจากชื่อเรื่อง แต่ฉันจะอธิบายรายละเอียดเพิ่มเติม
หลักสูตรนี้มุ่งเป้าไปที่ผู้ที่ใช้ Microsoft Excel ในการทำงานและใช้งานข้อมูลทั้งหมดที่นั่น โดยทั่วไป หากคุณเปิดแอปพลิเคชัน Microsoft Excel อย่างน้อยสัปดาห์ละครั้ง หลักสูตรนี้เหมาะสำหรับคุณ
คุณไม่จำเป็นต้องมีทักษะการเขียนโปรแกรมเพื่อจบหลักสูตร เนื่องจาก... หลักสูตรนี้มุ่งเป้าไปที่ผู้เริ่มต้น
แต่บางที เริ่มตั้งแต่บทที่ 4 ก็จะมีเนื้อหาที่น่าสนใจสำหรับผู้ใช้ R ที่ใช้งานอยู่เช่นกัน เพราะ... ฟังก์ชั่นหลักของแพ็คเกจเช่น dplyr
и tidyr
จะมีการหารือในรายละเอียดบางอย่าง
โปรแกรมหลักสูตร
บทที่ 1: การติดตั้งภาษา R และสภาพแวดล้อมการพัฒนา RStudio
วันที่เผยแพร่: 23 2020 มีนาคม
อ้างอิง:
วิดีโอ:
รายละเอียด:
บทเรียนเบื้องต้นที่เราจะดาวน์โหลดและติดตั้งซอฟต์แวร์ที่จำเป็น และตรวจสอบความสามารถและอินเทอร์เฟซของสภาพแวดล้อมการพัฒนา RStudio โดยย่อ
บทที่ 2: โครงสร้างข้อมูลพื้นฐานใน R
วันที่เผยแพร่: 30 2020 มีนาคม
อ้างอิง:
วิดีโอ:
รายละเอียด:
บทเรียนนี้จะช่วยให้คุณเข้าใจว่าโครงสร้างข้อมูลใดบ้างที่มีอยู่ในภาษา R เราจะดูรายละเอียดเกี่ยวกับเวกเตอร์ กรอบวันที่ และรายการ มาเรียนรู้วิธีสร้างและเข้าถึงแต่ละองค์ประกอบกัน
บทที่ 3: การอ่านข้อมูลจากไฟล์ TSV, CSV, Excel และ Google ชีต
วันที่เผยแพร่: 6 2020 เมษายน
อ้างอิง:
วิดีโอ:
รายละเอียด:
การทำงานกับข้อมูล ไม่ว่าจะใช้เครื่องมือใดก็ตาม เริ่มต้นจากการดึงข้อมูลออกมา แพ็คเกจที่ใช้ระหว่างบทเรียน vroom
, readxl
, googlesheets4
สำหรับการโหลดข้อมูลลงสู่สภาพแวดล้อม R จากไฟล์ csv, tsv, Excel และ Google Sheets
บทที่ 4: การกรองแถว การเลือกและเปลี่ยนชื่อคอลัมน์ ไปป์ไลน์ใน R
วันที่เผยแพร่: 13 2020 เมษายน
อ้างอิง:
วิดีโอ:
รายละเอียด:
บทเรียนนี้เกี่ยวกับแพ็คเกจ dplyr
. ในนั้นเราจะทราบวิธีการกรอง dataframes เลือกคอลัมน์ที่จำเป็นและเปลี่ยนชื่อ
นอกจากนี้เรายังจะได้เรียนรู้ว่าไปป์ไลน์คืออะไร และไปป์ไลน์ช่วยให้อ่านโค้ด R ของคุณได้ง่ายขึ้นได้อย่างไร
บทที่ 5: การเพิ่มคอลัมน์จากการคำนวณลงในตารางใน R
วันที่เผยแพร่: 20 2020 เมษายน
อ้างอิง:
วิดีโอ:
รายละเอียด:
ในวิดีโอนี้ เราจะมาทำความรู้จักกับห้องสมุดกันต่อ tidyverse
และแพ็คเกจ dplyr
.
มาดูครอบครัวของฟังก์ชั่นกัน mutate()
และเราจะเรียนรู้วิธีใช้เพื่อเพิ่มคอลัมน์จากการคำนวณใหม่ลงในตาราง
บทที่ 6: การจัดกลุ่มและการรวมข้อมูลใน R
วันที่เผยแพร่: 27 2020 เมษายน
อ้างอิง:
วิดีโอ:
รายละเอียด:
บทเรียนนี้เน้นไปที่การดำเนินการหลักประการหนึ่งของการวิเคราะห์ข้อมูล การจัดกลุ่ม และการรวมกลุ่ม ในระหว่างบทเรียนเราจะใช้แพ็คเกจ dplyr
และคุณสมบัติต่างๆ group_by()
и summarise()
.
เราจะดูฟังก์ชันทั้งหมดในกลุ่ม summarise()
เช่น summarise()
, summarise_if()
и summarise_at()
.
บทที่ 7: การรวมตารางในแนวตั้งและแนวนอนใน R
วันที่เผยแพร่: 4 2020 พฤษภาคม
อ้างอิง:
วิดีโอ:
รายละเอียด:
บทเรียนนี้จะช่วยให้คุณเข้าใจการดำเนินการของการรวมตารางในแนวตั้งและแนวนอน
ยูเนี่ยนแนวตั้งเทียบเท่ากับการดำเนินการ UNION ในภาษาคิวรี SQL
การรวมแนวนอนเป็นที่รู้จักกันดีสำหรับผู้ใช้ Excel เนื่องจากมีฟังก์ชัน VLOOKUP ใน SQL การดำเนินการดังกล่าวจะดำเนินการโดยตัวดำเนินการ JOIN
ในระหว่างบทเรียน เราจะแก้ปัญหาเชิงปฏิบัติในระหว่างที่เราจะใช้แพ็คเกจต่างๆ dplyr
, readxl
, tidyr
и stringr
.
หน้าที่หลักที่เราจะพิจารณา:
bind_rows()
- การรวมตารางแนวตั้งleft_join()
- การรวมตารางแนวนอนsemi_join()
- รวมทั้งการรวมตารางด้วยanti_join()
- เข้าร่วมตารางพิเศษ
บทที่ 8: ฟังก์ชั่นหน้าต่างใน R
วันที่เผยแพร่: 11 2020 พฤษภาคม
อ้างอิง:
รายละเอียด:
ฟังก์ชั่นหน้าต่างมีความหมายคล้ายกับการรวมเข้าด้วยกัน พวกเขายังรับอาร์เรย์ของค่าเป็นอินพุตและดำเนินการทางคณิตศาสตร์กับพวกเขา แต่อย่าเปลี่ยนจำนวนแถวในผลลัพธ์เอาต์พุต
ในบทช่วยสอนนี้ เราจะศึกษาแพ็คเกจต่อไป dplyr
และฟังก์ชัน group_by()
, mutate()
เช่นเดียวกับใหม่ cumsum()
, lag()
, lead()
и arrange()
.
บทที่ 9: การหมุนตารางหรืออะนาล็อกของตารางเดือยใน R
วันที่เผยแพร่: 18 2020 พฤษภาคม
อ้างอิง:
รายละเอียด:
ผู้ใช้ Excel ส่วนใหญ่ใช้ตาราง Pivot นี่เป็นเครื่องมือที่สะดวกซึ่งคุณสามารถเปลี่ยนอาร์เรย์ข้อมูลดิบให้เป็นรายงานที่อ่านได้ในเวลาไม่กี่วินาที
ในบทช่วยสอนนี้ เราจะดูวิธีการหมุนตารางใน R และแปลงตารางจากรูปแบบกว้างเป็นรูปแบบยาว และในทางกลับกัน
บทเรียนส่วนใหญ่จะเน้นไปที่แพ็คเกจโดยเฉพาะ tidyr
และฟังก์ชั่น pivot_longer()
и pivot_wider()
.
บทที่ 10: การโหลดไฟล์ JSON ใน R และการแปลงรายการเป็นตาราง
วันที่เผยแพร่: 25 2020 พฤษภาคม
อ้างอิง:
รายละเอียด:
JSON และ XML เป็นรูปแบบที่นิยมอย่างมากในการจัดเก็บและแลกเปลี่ยนข้อมูล ซึ่งมักเกิดจากความกะทัดรัด
แต่การวิเคราะห์ข้อมูลที่นำเสนอในรูปแบบดังกล่าวเป็นเรื่องยาก ดังนั้นก่อนการวิเคราะห์จึงจำเป็นต้องนำมาเป็นรูปแบบตาราง ซึ่งนั่นคือสิ่งที่เราจะเรียนรู้ในวิดีโอนี้
บทเรียนนี้เน้นไปที่แพ็คเกจโดยเฉพาะ tidyr
รวมอยู่ในแกนกลางของห้องสมุด tidyverse
และฟังก์ชัน unnest_longer()
, unnest_wider()
и hoist()
.
บทที่ 11: การวางแผนอย่างรวดเร็วโดยใช้ฟังก์ชัน qplot()
วันที่เผยแพร่: 1 2020 มิถุนายน
อ้างอิง:
รายละเอียด:
บรรจุภัณฑ์ ggplot2
เป็นหนึ่งในเครื่องมือสร้างภาพข้อมูลที่ได้รับความนิยมมากที่สุด ไม่เพียงแต่ใน R เท่านั้น
ในบทนี้ เราจะได้เรียนรู้วิธีสร้างกราฟอย่างง่ายโดยใช้ฟังก์ชัน qplot()
และมาวิเคราะห์ข้อโต้แย้งของเธอทั้งหมดกัน
บทที่ 12: การลงจุดทีละชั้นโดยใช้แพ็คเกจ ggplot2
วันที่เผยแพร่: 8 2020 มิถุนายน
อ้างอิง:
รายละเอียด:
บทเรียนนี้แสดงให้เห็นถึงพลังทั้งหมดของแพ็คเกจ ggplot2
และไวยากรณ์ของการสร้างกราฟเป็นชั้นๆ ที่ฝังอยู่ในนั้น
เราจะวิเคราะห์รูปทรงเรขาคณิตหลักที่มีอยู่ในแพ็คเกจและเรียนรู้วิธีใช้เลเยอร์เพื่อสร้างกราฟ
ข้อสรุป
ฉันพยายามเข้าใกล้การก่อตัวของโปรแกรมหลักสูตรให้กระชับที่สุดเท่าที่จะเป็นไปได้เพื่อเน้นเฉพาะข้อมูลที่จำเป็นที่สุดที่คุณต้องการเพื่อดำเนินการขั้นตอนแรกในการเรียนรู้เครื่องมือวิเคราะห์ข้อมูลที่ทรงพลังเช่นภาษา R
หลักสูตรนี้ไม่ใช่คำแนะนำโดยละเอียดสำหรับการวิเคราะห์ข้อมูลโดยใช้ภาษา R แต่จะช่วยให้คุณเข้าใจเทคนิคที่จำเป็นทั้งหมดสำหรับสิ่งนี้
แม้ว่าหลักสูตรหลักสูตรจะออกแบบไว้ 12 สัปดาห์ แต่ทุกวันจันทร์ผมจะเปิดให้เข้าถึงบทเรียนใหม่ๆ ดังนั้นผมขอแนะนำ
ที่มา: will.com