ภาษา R สำหรับผู้ใช้ Excel (หลักสูตรวิดีโอฟรี)

เนื่องจากการกักตัว ทำให้หลายคนใช้เวลาอยู่ที่บ้านเป็นจำนวนมาก และเวลานี้สามารถทำได้และแม้กระทั่งควรจะใช้เวลาให้เกิดประโยชน์ด้วยซ้ำ

ในช่วงเริ่มต้นของการกักกัน ฉันตัดสินใจทำบางโปรเจ็กต์ที่เริ่มไว้เมื่อไม่กี่เดือนก่อนให้เสร็จ หนึ่งในโครงการเหล่านี้คือหลักสูตรวิดีโอ “ภาษา R สำหรับผู้ใช้ Excel” ด้วยหลักสูตรนี้ ฉันต้องการลดอุปสรรคในการเข้าสู่ R และเติมเต็มเนื้อหาการฝึกอบรมที่มีอยู่ในภาษารัสเซียในหัวข้อนี้ที่ขาดแคลนเล็กน้อย

หากทุกอย่างทำงานกับข้อมูลในบริษัทที่คุณทำงานด้วยใน Excel ฉันขอแนะนำให้คุณทำความคุ้นเคยกับเครื่องมือวิเคราะห์ข้อมูลที่ทันสมัยกว่าและในขณะเดียวกันก็ฟรีโดยสมบูรณ์

ภาษา R สำหรับผู้ใช้ Excel (หลักสูตรวิดีโอฟรี)

Содержание

หากคุณสนใจในการวิเคราะห์ข้อมูล คุณอาจสนใจใน my โทรเลข и YouTube ช่อง. เนื้อหาส่วนใหญ่เกี่ยวกับภาษา R

  1. การอ้างอิง
  2. เกี่ยวกับหลักสูตร
  3. หลักสูตรนี้เหมาะกับใครบ้าง?
  4. โปรแกรมหลักสูตร
    4.1. บทที่ 1: การติดตั้งภาษา R และสภาพแวดล้อมการพัฒนา RStudio
    4.2. บทที่ 2: โครงสร้างข้อมูลพื้นฐานใน R
    4.3. บทที่ 3: การอ่านข้อมูลจากไฟล์ TSV, CSV, Excel และ Google ชีต
    4.4. บทที่ 4: การกรองแถว การเลือกและเปลี่ยนชื่อคอลัมน์ ไปป์ไลน์ใน R
    4.5. บทที่ 5: การเพิ่มคอลัมน์จากการคำนวณลงในตารางใน R
    4.6. บทที่ 6: การจัดกลุ่มและการรวมข้อมูลใน R
    4.7. บทที่ 7: การรวมตารางในแนวตั้งและแนวนอนใน R
    4.8. บทที่ 8: ฟังก์ชั่นหน้าต่างใน R
    4.9. บทที่ 9: การหมุนตารางหรืออะนาล็อกของตารางเดือยใน R
    4.10. บทที่ 10: การโหลดไฟล์ JSON ใน R และการแปลงรายการเป็นตาราง
    4.11. บทที่ 11: การวางแผนอย่างรวดเร็วโดยใช้ฟังก์ชัน qplot()
    4.12. บทที่ 12: การลงจุดทีละชั้นโดยใช้แพ็คเกจ ggplot2
  5. ข้อสรุป

การอ้างอิง

เกี่ยวกับหลักสูตร

หลักสูตรนี้เน้นสถาปัตยกรรมเป็นหลัก tidyverseและแพ็คเกจที่รวมอยู่ในนั้น: readr, vroom, dplyr, tidyr, ggplot2. แน่นอนว่ายังมีแพ็คเกจดีๆ อื่นๆ ใน R ที่ทำงานคล้ายกัน เป็นต้น data.tableแต่ไวยากรณ์ tidyverse ใช้งานง่าย อ่านง่ายแม้สำหรับผู้ใช้ที่ไม่ผ่านการฝึกอบรม ดังนั้น ฉันคิดว่าเป็นการดีกว่าที่จะเริ่มเรียนรู้ภาษา R ด้วย tidyverse.

หลักสูตรนี้จะแนะนำคุณตลอดการดำเนินการวิเคราะห์ข้อมูลทั้งหมด ตั้งแต่การโหลดไปจนถึงการแสดงภาพผลลัพธ์ที่เสร็จสมบูรณ์

ทำไมต้อง R ไม่ใช่ Python? เนื่องจาก R เป็นภาษาที่ใช้งานได้ ผู้ใช้ Excel จึงสามารถสลับไปใช้ภาษาดังกล่าวได้ง่ายกว่า เนื่องจาก ไม่จำเป็นต้องเจาะลึกการเขียนโปรแกรมเชิงวัตถุแบบดั้งเดิม

ในขณะนี้มีการวางแผนบทเรียนวิดีโอ 12 บทเรียน ครั้งละ 5 ถึง 20 นาที

บทเรียนจะค่อยๆเปิดขึ้น ทุกวันจันทร์ ฉันจะเปิดให้เข้าถึงบทเรียนใหม่บนเว็บไซต์ของฉัน ช่องยูทูป ในเพลย์ลิสต์แยกต่างหาก

หลักสูตรนี้เหมาะกับใครบ้าง?

ฉันคิดว่าเรื่องนี้ชัดเจนจากชื่อเรื่อง แต่ฉันจะอธิบายรายละเอียดเพิ่มเติม

หลักสูตรนี้มุ่งเป้าไปที่ผู้ที่ใช้ Microsoft Excel ในการทำงานและใช้งานข้อมูลทั้งหมดที่นั่น โดยทั่วไป หากคุณเปิดแอปพลิเคชัน Microsoft Excel อย่างน้อยสัปดาห์ละครั้ง หลักสูตรนี้เหมาะสำหรับคุณ

คุณไม่จำเป็นต้องมีทักษะการเขียนโปรแกรมเพื่อจบหลักสูตร เนื่องจาก... หลักสูตรนี้มุ่งเป้าไปที่ผู้เริ่มต้น

แต่บางที เริ่มตั้งแต่บทที่ 4 ก็จะมีเนื้อหาที่น่าสนใจสำหรับผู้ใช้ R ที่ใช้งานอยู่เช่นกัน เพราะ... ฟังก์ชั่นหลักของแพ็คเกจเช่น dplyr и tidyr จะมีการหารือในรายละเอียดบางอย่าง

โปรแกรมหลักสูตร

บทที่ 1: การติดตั้งภาษา R และสภาพแวดล้อมการพัฒนา RStudio

วันที่เผยแพร่: 23 2020 มีนาคม

อ้างอิง:

วิดีโอ:

รายละเอียด:
บทเรียนเบื้องต้นที่เราจะดาวน์โหลดและติดตั้งซอฟต์แวร์ที่จำเป็น และตรวจสอบความสามารถและอินเทอร์เฟซของสภาพแวดล้อมการพัฒนา RStudio โดยย่อ

บทที่ 2: โครงสร้างข้อมูลพื้นฐานใน R

วันที่เผยแพร่: 30 2020 มีนาคม

อ้างอิง:

วิดีโอ:

รายละเอียด:
บทเรียนนี้จะช่วยให้คุณเข้าใจว่าโครงสร้างข้อมูลใดบ้างที่มีอยู่ในภาษา R เราจะดูรายละเอียดเกี่ยวกับเวกเตอร์ กรอบวันที่ และรายการ มาเรียนรู้วิธีสร้างและเข้าถึงแต่ละองค์ประกอบกัน

บทที่ 3: การอ่านข้อมูลจากไฟล์ TSV, CSV, Excel และ Google ชีต

วันที่เผยแพร่: 6 2020 เมษายน

อ้างอิง:

วิดีโอ:

รายละเอียด:
การทำงานกับข้อมูล ไม่ว่าจะใช้เครื่องมือใดก็ตาม เริ่มต้นจากการดึงข้อมูลออกมา แพ็คเกจที่ใช้ระหว่างบทเรียน vroom, readxl, googlesheets4 สำหรับการโหลดข้อมูลลงสู่สภาพแวดล้อม R จากไฟล์ csv, tsv, Excel และ Google Sheets

บทที่ 4: การกรองแถว การเลือกและเปลี่ยนชื่อคอลัมน์ ไปป์ไลน์ใน R

วันที่เผยแพร่: 13 2020 เมษายน

อ้างอิง:

วิดีโอ:

รายละเอียด:
บทเรียนนี้เกี่ยวกับแพ็คเกจ dplyr. ในนั้นเราจะทราบวิธีการกรอง dataframes เลือกคอลัมน์ที่จำเป็นและเปลี่ยนชื่อ

นอกจากนี้เรายังจะได้เรียนรู้ว่าไปป์ไลน์คืออะไร และไปป์ไลน์ช่วยให้อ่านโค้ด R ของคุณได้ง่ายขึ้นได้อย่างไร

บทที่ 5: การเพิ่มคอลัมน์จากการคำนวณลงในตารางใน R

วันที่เผยแพร่: 20 2020 เมษายน

อ้างอิง:

วิดีโอ:

รายละเอียด:
ในวิดีโอนี้ เราจะมาทำความรู้จักกับห้องสมุดกันต่อ tidyverse และแพ็คเกจ dplyr.
มาดูครอบครัวของฟังก์ชั่นกัน mutate()และเราจะเรียนรู้วิธีใช้เพื่อเพิ่มคอลัมน์จากการคำนวณใหม่ลงในตาราง

บทที่ 6: การจัดกลุ่มและการรวมข้อมูลใน R

วันที่เผยแพร่: 27 2020 เมษายน

อ้างอิง:

วิดีโอ:

รายละเอียด:
บทเรียนนี้เน้นไปที่การดำเนินการหลักประการหนึ่งของการวิเคราะห์ข้อมูล การจัดกลุ่ม และการรวมกลุ่ม ในระหว่างบทเรียนเราจะใช้แพ็คเกจ dplyr และคุณสมบัติต่างๆ group_by() и summarise().

เราจะดูฟังก์ชันทั้งหมดในกลุ่ม summarise()เช่น summarise(), summarise_if() и summarise_at().

บทที่ 7: การรวมตารางในแนวตั้งและแนวนอนใน R

วันที่เผยแพร่: 4 2020 พฤษภาคม

อ้างอิง:

วิดีโอ:

รายละเอียด:
บทเรียนนี้จะช่วยให้คุณเข้าใจการดำเนินการของการรวมตารางในแนวตั้งและแนวนอน

ยูเนี่ยนแนวตั้งเทียบเท่ากับการดำเนินการ UNION ในภาษาคิวรี SQL

การรวมแนวนอนเป็นที่รู้จักกันดีสำหรับผู้ใช้ Excel เนื่องจากมีฟังก์ชัน VLOOKUP ใน SQL การดำเนินการดังกล่าวจะดำเนินการโดยตัวดำเนินการ JOIN

ในระหว่างบทเรียน เราจะแก้ปัญหาเชิงปฏิบัติในระหว่างที่เราจะใช้แพ็คเกจต่างๆ dplyr, readxl, tidyr и stringr.

หน้าที่หลักที่เราจะพิจารณา:

  • bind_rows() - การรวมตารางแนวตั้ง
  • left_join() - การรวมตารางแนวนอน
  • semi_join() - รวมทั้งการรวมตารางด้วย
  • anti_join() - เข้าร่วมตารางพิเศษ

บทที่ 8: ฟังก์ชั่นหน้าต่างใน R

วันที่เผยแพร่: 11 2020 พฤษภาคม

อ้างอิง:

รายละเอียด:
ฟังก์ชั่นหน้าต่างมีความหมายคล้ายกับการรวมเข้าด้วยกัน พวกเขายังรับอาร์เรย์ของค่าเป็นอินพุตและดำเนินการทางคณิตศาสตร์กับพวกเขา แต่อย่าเปลี่ยนจำนวนแถวในผลลัพธ์เอาต์พุต

ในบทช่วยสอนนี้ เราจะศึกษาแพ็คเกจต่อไป dplyrและฟังก์ชัน group_by(), mutate()เช่นเดียวกับใหม่ cumsum(), lag(), lead() и arrange().

บทที่ 9: การหมุนตารางหรืออะนาล็อกของตารางเดือยใน R

วันที่เผยแพร่: 18 2020 พฤษภาคม

อ้างอิง:

รายละเอียด:
ผู้ใช้ Excel ส่วนใหญ่ใช้ตาราง Pivot นี่เป็นเครื่องมือที่สะดวกซึ่งคุณสามารถเปลี่ยนอาร์เรย์ข้อมูลดิบให้เป็นรายงานที่อ่านได้ในเวลาไม่กี่วินาที

ในบทช่วยสอนนี้ เราจะดูวิธีการหมุนตารางใน R และแปลงตารางจากรูปแบบกว้างเป็นรูปแบบยาว และในทางกลับกัน

บทเรียนส่วนใหญ่จะเน้นไปที่แพ็คเกจโดยเฉพาะ tidyr และฟังก์ชั่น pivot_longer() и pivot_wider().

บทที่ 10: การโหลดไฟล์ JSON ใน R และการแปลงรายการเป็นตาราง

วันที่เผยแพร่: 25 2020 พฤษภาคม

อ้างอิง:

รายละเอียด:
JSON และ XML เป็นรูปแบบที่นิยมอย่างมากในการจัดเก็บและแลกเปลี่ยนข้อมูล ซึ่งมักเกิดจากความกะทัดรัด

แต่การวิเคราะห์ข้อมูลที่นำเสนอในรูปแบบดังกล่าวเป็นเรื่องยาก ดังนั้นก่อนการวิเคราะห์จึงจำเป็นต้องนำมาเป็นรูปแบบตาราง ซึ่งนั่นคือสิ่งที่เราจะเรียนรู้ในวิดีโอนี้

บทเรียนนี้เน้นไปที่แพ็คเกจโดยเฉพาะ tidyrรวมอยู่ในแกนกลางของห้องสมุด tidyverseและฟังก์ชัน unnest_longer(), unnest_wider() и hoist().

บทที่ 11: การวางแผนอย่างรวดเร็วโดยใช้ฟังก์ชัน qplot()

วันที่เผยแพร่: 1 2020 มิถุนายน

อ้างอิง:

รายละเอียด:
บรรจุภัณฑ์ ggplot2 เป็นหนึ่งในเครื่องมือสร้างภาพข้อมูลที่ได้รับความนิยมมากที่สุด ไม่เพียงแต่ใน R เท่านั้น

ในบทนี้ เราจะได้เรียนรู้วิธีสร้างกราฟอย่างง่ายโดยใช้ฟังก์ชัน qplot()และมาวิเคราะห์ข้อโต้แย้งของเธอทั้งหมดกัน

บทที่ 12: การลงจุดทีละชั้นโดยใช้แพ็คเกจ ggplot2

วันที่เผยแพร่: 8 2020 มิถุนายน

อ้างอิง:

รายละเอียด:
บทเรียนนี้แสดงให้เห็นถึงพลังทั้งหมดของแพ็คเกจ ggplot2 และไวยากรณ์ของการสร้างกราฟเป็นชั้นๆ ที่ฝังอยู่ในนั้น

เราจะวิเคราะห์รูปทรงเรขาคณิตหลักที่มีอยู่ในแพ็คเกจและเรียนรู้วิธีใช้เลเยอร์เพื่อสร้างกราฟ

ข้อสรุป

ฉันพยายามเข้าใกล้การก่อตัวของโปรแกรมหลักสูตรให้กระชับที่สุดเท่าที่จะเป็นไปได้เพื่อเน้นเฉพาะข้อมูลที่จำเป็นที่สุดที่คุณต้องการเพื่อดำเนินการขั้นตอนแรกในการเรียนรู้เครื่องมือวิเคราะห์ข้อมูลที่ทรงพลังเช่นภาษา R

หลักสูตรนี้ไม่ใช่คำแนะนำโดยละเอียดสำหรับการวิเคราะห์ข้อมูลโดยใช้ภาษา R แต่จะช่วยให้คุณเข้าใจเทคนิคที่จำเป็นทั้งหมดสำหรับสิ่งนี้

แม้ว่าหลักสูตรหลักสูตรจะออกแบบไว้ 12 สัปดาห์ แต่ทุกวันจันทร์ผมจะเปิดให้เข้าถึงบทเรียนใหม่ๆ ดังนั้นผมขอแนะนำ สมัครเป็นสมาชิก ในช่อง YouTube เพื่อไม่ให้พลาดการเผยแพร่บทเรียนใหม่

ที่มา: will.com

เพิ่มความคิดเห็น