ก่อนที่จะลงทะเบียนในหลักสูตร Machine Learning Advanced ใหม่ เราจะทดสอบผู้สนใจศึกษาเพื่อกำหนดระดับความพร้อมและทำความเข้าใจสิ่งที่พวกเขาต้องเสนอเพื่อเตรียมตัวสำหรับหลักสูตรนี้ แต่เกิดภาวะที่กลืนไม่เข้าคายไม่ออก ในด้านหนึ่งเราต้องทดสอบความรู้ด้าน Data Science อีกด้านหนึ่งเราไม่สามารถจัดให้มีการสอบ 4 ชั่วโมงเต็มได้
เพื่อแก้ไขปัญหานี้ เราได้ปรับใช้สำนักงานใหญ่ TestDev ในทีมพัฒนาหลักสูตร Data Science (และดูเหมือนว่านี่เป็นเพียงจุดเริ่มต้น) เรานำเสนอรายการข้อผิดพลาด 10 ประการที่คุณพบเมื่อพัฒนาแบบทดสอบเพื่อประเมินความรู้ หวังว่าโลกของการเรียนรู้ออนไลน์จะดีขึ้นเล็กน้อยหลังจากนี้
คราด 1: ไม่สามารถกำหนดเป้าหมายการทดสอบได้อย่างชัดเจน
เพื่อที่จะกำหนดเป้าหมายได้อย่างถูกต้องและสร้างการทดสอบที่จะนำมาพิจารณา ในขั้นตอนการวางแผน เราต้องตอบคำถามหลายข้อ:
- จริงๆแล้วเรากำลังตรวจสอบอะไรอยู่?
- การทดสอบจะเกิดขึ้นในสภาพแวดล้อมใด และใช้กลไกใดบ้าง ข้อจำกัดในสภาพแวดล้อมนี้มีอะไรบ้าง? จุดเดียวกันนี้จะช่วยให้คุณเข้าใจข้อกำหนดทางเทคนิคสำหรับอุปกรณ์ที่จะทำการทดสอบและสำหรับเนื้อหาด้วย (หากทำการทดสอบจากโทรศัพท์ ควรอ่านรูปภาพได้แม้บนหน้าจอขนาดเล็กก็ตาม สามารถขยายขนาดได้ ฯลฯ)
- การทดสอบจะใช้เวลานานเท่าใด? คุณต้องคิดถึงเงื่อนไขที่ผู้ใช้จะทำการทดสอบ มีสถานการณ์ที่เขาจำเป็นต้องขัดขวางกระบวนการทดสอบแล้วดำเนินการต่ออีกครั้งหรือไม่?
- จะมีการตอบรับหรือไม่? เราจะสร้างและส่งมอบได้อย่างไร? คุณต้องการรับอะไร? มีเวลาหน่วงระหว่างการดำเนินการทดสอบและคำติชมหรือไม่
ในกรณีของเรา หลังจากที่ตอบคำถามเหล่านี้แล้ว เราได้กำหนดรายการเป้าหมายสำหรับการทดสอบต่อไปนี้:
- การทดสอบควรแสดงให้เห็นว่านักเรียนในอนาคตพร้อมที่จะเรียนหลักสูตรนี้หรือไม่ และมีความรู้และทักษะเพียงพอหรือไม่
- การทดสอบควรให้ข้อมูลย้อนกลับ ระบุหัวข้อที่นักเรียนทำผิดพลาด เพื่อพัฒนาความรู้ของตนเอง เราจะบอกวิธีเขียนด้านล่างนี้
คราด 2: ความล้มเหลวในการกำหนดข้อกำหนดทางเทคนิคสำหรับผู้เขียนการทดสอบที่เชี่ยวชาญ
ในการเขียนรายการทดสอบ เป็นสิ่งสำคัญมากที่จะต้องให้ผู้เชี่ยวชาญในสาขาที่กำลังทดสอบความรู้มีส่วนร่วม และสำหรับผู้เชี่ยวชาญ คุณจะต้องมีข้อกำหนดทางเทคนิคที่มีความสามารถ (คำอธิบาย) ซึ่งรวมถึงหัวข้อการทดสอบ ความรู้/ทักษะที่กำลังทดสอบ และระดับของการทดสอบ
ผู้เชี่ยวชาญจะไม่ทำข้อกำหนดทางเทคนิคดังกล่าวเพื่อตนเอง เพราะงานของเขาคือคิดงาน ไม่ใช่โครงสร้างของการทดสอบ ยิ่งไปกว่านั้น มีเพียงไม่กี่คนที่พัฒนาแบบทดสอบอย่างมืออาชีพ แม้แต่ในกระบวนการสอนก็ตาม สิ่งนี้สอนในสาขาวิชาพิเศษเฉพาะ - ไซโครเมทริก
หากคุณต้องการทำความคุ้นเคยกับไซโครเมทริกอย่างรวดเร็วแสดงว่ามีในรัสเซีย
เมื่อเตรียมข้อกำหนดทางเทคนิค เราจะรวบรวมคำอธิบายโดยละเอียดของการทดสอบสำหรับผู้เชี่ยวชาญ (หรือดีกว่านั้นร่วมกับเขา): หัวข้อของงาน ประเภทงาน จำนวนงาน
วิธีเลือกประเภทของงาน: เมื่อตัดสินใจเลือกหัวข้อแล้ว เราตัดสินใจว่างานใดที่สามารถทดสอบสิ่งนี้ได้ดีที่สุด? ตัวเลือกแบบคลาสสิก: งานปลายเปิด งานหลายตัวเลือกหรือหลายตัวเลือก การจับคู่ ฯลฯ (อย่าลืมเกี่ยวกับข้อจำกัดทางเทคนิคของสภาพแวดล้อมการทดสอบ!) หลังจากกำหนดและระบุประเภทของงานแล้ว เราก็มีข้อกำหนดทางเทคนิคสำเร็จรูปสำหรับผู้เชี่ยวชาญ คุณสามารถเรียกมันว่าข้อกำหนดการทดสอบได้
คราด 3: ไม่เกี่ยวข้องกับผู้เชี่ยวชาญในการพัฒนาการทดสอบ
เมื่อรับสมัครผู้เชี่ยวชาญในการพัฒนาการทดสอบ สิ่งสำคัญมากคือไม่เพียงแต่จะต้องระบุ "ขอบเขตของงาน" ให้เขาทราบเท่านั้น แต่ยังต้องให้เขามีส่วนร่วมในขั้นตอนการพัฒนาด้วย
วิธีทำให้การทำงานกับผู้เชี่ยวชาญมีประสิทธิผลมากที่สุด:
- จัดเตรียมไว้ล่วงหน้าและใช้เวลาพูดคุยเกี่ยวกับวิทยาศาสตร์ของการพัฒนาแบบทดสอบและไซโครเมทริก
- มุ่งความสนใจของผู้ประเมินไปที่การสร้างเครื่องมือการประเมินที่ถูกต้องและเชื่อถือได้ ไม่ใช่รายการคำถาม
- อธิบายว่างานของเขาครอบคลุมถึงขั้นเตรียมการ ไม่ใช่แค่การพัฒนางานเท่านั้น
ผู้เชี่ยวชาญบางคน (เนื่องจากธรรมชาติของพวกเขา) อาจมองว่านี่เป็นการทดสอบงานของตนเอง และเราอธิบายให้พวกเขาฟังว่าแม้ว่าเราจะสร้างงานที่ยอดเยี่ยม พวกเขาก็อาจไม่เหมาะกับเป้าหมายการทดสอบเฉพาะเจาะจง
เพื่อให้กระบวนการดำเนินไปอย่างรวดเร็ว เราได้เตรียมตารางครอบคลุมหัวข้อ (ความรู้และทักษะ) กับผู้เชี่ยวชาญ ซึ่งเป็นส่วนหนึ่งของข้อกำหนดการทดสอบ เป็นตารางนี้ที่ช่วยให้เราสามารถตอบคำถามได้อย่างถูกต้องและกำหนดสิ่งที่เราจะวัด ในแต่ละกรณีสามารถรวบรวมได้แตกต่างกันเล็กน้อย งานของเราคือการตรวจสอบว่าบุคคลเข้าใจความรู้และทักษะของหลักสูตรพื้นฐานก่อนหน้าได้ดีเพียงใดเพื่อทำความเข้าใจว่าเขาพร้อมแค่ไหนที่จะเรียนในหลักสูตรใหม่
คราด 4: คิดว่าผู้เชี่ยวชาญ “รู้ดีที่สุด”
รู้หัวข้อดีขึ้น แต่ไม่ได้อธิบายให้ชัดเจนเสมอไป การตรวจสอบถ้อยคำของงานเป็นสิ่งสำคัญมาก เขียนคำแนะนำที่ชัดเจน เช่น “เลือก 1 ตัวเลือกที่ถูกต้อง” ใน 90% ของกรณี ผู้เชี่ยวชาญเตรียมคำถามในแบบที่พวกเขาเข้าใจด้วยตนเอง และก็ไม่เป็นไร แต่ก่อนที่จะส่งมอบแบบทดสอบให้กับผู้ที่จะเข้าสอบ ทุกอย่างจะต้องได้รับการตรวจสอบและหวีเพื่อให้ผู้เข้าสอบเข้าใจอย่างชัดเจนถึงสิ่งที่จำเป็น และไม่ทำผิดพลาดเพียงเพราะพวกเขาอาจตีความเนื้อหาของงานผิด
เพื่อหลีกเลี่ยงการตีความงานซ้ำซ้อน เราจึงดำเนินการ "ห้องปฏิบัติการทางปัญญา" เราขอให้ผู้คนจากกลุ่มเป้าหมายทำแบบทดสอบโดยพูดออกมาดัง ๆ ว่าพวกเขาคิดอย่างไรและบันทึกไว้อย่างละเอียด ที่ "ห้องปฏิบัติการทางปัญญา" คุณสามารถ "จับ" คำถามที่ไม่ชัดเจน การใช้ถ้อยคำที่ไม่เหมาะสม และรับผลตอบรับในการทดสอบครั้งแรก
คราด 5: ละเว้นเวลาดำเนินการทดสอบ
โหมดเสียดสี: เปิด
แน่นอนว่าการทดสอบของเราดีที่สุด ทุกคนใฝ่ฝันที่จะผ่านมันไป! ใช่ ทั้งหมด 4 ชั่วโมง
โหมดเสียดสี: ปิด
เมื่อมีรายการทุกอย่างที่ตรวจสอบได้ สิ่งสำคัญคือ ไม่ต้องทำ (มองแวบแรกฟังดูแปลกๆ ใช่ไหม?) คุณต้องตัดอย่างไร้ความปราณีโดยระบุความรู้และทักษะหลักกับผู้เชี่ยวชาญ (ใช่ คุณสามารถทดสอบทักษะจำนวนหนึ่งได้ในการทดสอบ) เราดูประเภทของงานและประมาณเวลาที่จะสำเร็จตามเป้าหมาย: หากทุกอย่างยังเกินขีดจำกัดที่สมเหตุสมผล เราก็จะตัดมันทิ้ง!
หากต้องการลดระดับเสียง คุณสามารถลองทดสอบสองทักษะ (อย่างระมัดระวัง) ในงานเดียวได้ ในกรณีนี้ เป็นการยากที่จะเข้าใจว่าเหตุใดบุคคลนั้นจึงทำผิดพลาด แต่ถ้าทำอย่างถูกต้อง ทักษะทั้งสองก็สามารถนำมาพิจารณาได้ สิ่งสำคัญคือต้องแน่ใจว่าทักษะ 2 นี้สอดคล้องกับความรู้เดียวกัน
เรค 6: ไม่คิดผ่านระบบการให้คะแนน
บ่อยครั้งเมื่อรวบรวมแบบทดสอบประเมินจะใช้ระบบการให้คะแนนแบบคลาสสิก เช่น 1 คะแนนสำหรับงานที่ง่าย และ 2 คะแนนสำหรับงานที่ยาก แต่มันไม่ใช่สากล ผลรวมของคะแนนจากผลการทดสอบไม่ได้บอกอะไรเรามากนัก เราไม่รู้ว่าคะแนนเหล่านี้ได้รับจากงานใด และเราสามารถระบุได้เพียงจำนวนงานที่ถูกต้องเท่านั้น เราต้องเข้าใจว่าผู้สอบกำลังแสดงทักษะใดบ้าง นอกจากนี้ เราต้องการแสดงความคิดเห็นเกี่ยวกับหัวข้อที่ต้องปรับปรุง
ท้ายที่สุดแล้ว เรากำลังทำแบบทดสอบโดยแบ่งคนออกเป็นคนที่พร้อมและไม่พร้อมจะจบหลักสูตร เราจะแนะนำให้บางคนเตรียมตัวสำหรับหลักสูตรผ่านการฝึกอบรมฟรี เป็นสิ่งสำคัญสำหรับเราที่กลุ่มนี้รวมเฉพาะผู้ที่ต้องการมันจริงๆ และผู้ที่พร้อมสำหรับมันเท่านั้น
สิ่งที่เราทำในสถานการณ์ของเรา: เรากำหนดภายในคณะทำงานของนักพัฒนาทดสอบว่ากลุ่มคนใดที่ต้องระบุ (เช่น พร้อมที่จะเรียนรู้ พร้อมบางส่วน) และสร้างตารางลักษณะของกลุ่มดังกล่าว ระบุว่าทักษะและความรู้ใด จะเกี่ยวข้องกับกลุ่มฝึกอบรมพร้อมเรียนรู้ วิธีนี้ทำให้คุณสามารถกำหนด "ความยาก" ของงานสำหรับการทดสอบดังกล่าวได้
คราด 7: ประเมินผลลัพธ์โดยอัตโนมัติเท่านั้น
แน่นอนว่า การประเมินควรเป็นไปตามวัตถุประสงค์ที่สุดเท่าที่จะเป็นไปได้ ดังนั้นสื่อการสอนของนักเรียนบางส่วนจะได้รับการประเมินโดยอัตโนมัติ "ตามคีย์" - เปรียบเทียบกับคำตอบที่ถูกต้อง แม้ว่าจะไม่มีระบบการทดสอบพิเศษ แต่ก็มีวิธีแก้ปัญหาฟรีมากมาย และถ้าคุณเข้าใจหลักการเขียนสคริปต์ คุณก็สามารถทำอะไรก็ได้ที่ต้องการด้วยแบบฟอร์มของ Google และผลลัพธ์ในตาราง หากงานบางอย่างได้รับการตรวจสอบโดยผู้เชี่ยวชาญ เราต้องคิดถึงการส่งคำตอบให้กับผู้เชี่ยวชาญ โดยไม่มีข้อมูลเกี่ยวกับผู้สอบ และคิดหาวิธีบูรณาการผลการทดสอบของผู้เชี่ยวชาญเข้ากับการประเมินขั้นสุดท้าย
ในตอนแรก เราต้องการสร้างงานปลายเปิดหลายๆ งานด้วยโค้ด โดยที่ผู้เชี่ยวชาญประเมินวิธีแก้ปัญหาตามเกณฑ์ที่กำหนดไว้ล่วงหน้า และเรายังเตรียมระบบที่ส่งออกคำตอบแต่ละรายการจากผู้เข้าร่วมการทดสอบไปยังตารางพิเศษสำหรับผู้เชี่ยวชาญ จากนั้นจึงนำเข้าผลลัพธ์ไปที่ ตารางการคำนวณการประเมิน แต่หลังจากหารือกับตัวแทนของกลุ่มเป้าหมาย ผู้จัดการผลิตภัณฑ์ และนักออกแบบด้านการศึกษาแล้ว เรารู้สึกว่าการดำเนินการสัมภาษณ์ทางเทคนิคพร้อมคำติชมจากผู้เชี่ยวชาญทันทีและการอภิปรายเกี่ยวกับโค้ด รวมถึงปัญหาส่วนบุคคล จะมีประสิทธิภาพและเป็นประโยชน์มากขึ้นสำหรับผู้เข้าร่วมเอง .
ตอนนี้ผู้เชี่ยวชาญตรวจสอบความสมบูรณ์ของการทดสอบ พร้อมชี้แจงคำถามบางข้อ เพื่อดำเนินการนี้ เราได้เตรียมคำแนะนำสำหรับคำถามและเกณฑ์การประเมินสำหรับการสัมภาษณ์ทางเทคนิค ก่อนการสัมภาษณ์ทางเทคนิค ผู้สอบจะได้รับแผนที่คำตอบของผู้สอบเพื่อช่วยเลือกคำถามที่จะถาม
คราด 8: ไม่ต้องอธิบายผลการทดสอบ
การให้ข้อเสนอแนะแก่ผู้เข้าร่วมเป็นประเด็นแยกต่างหาก เราไม่เพียงต้องแจ้งคะแนนสอบเท่านั้น แต่ยังต้องทำความเข้าใจผลการทดสอบด้วย
เหล่านี้สามารถ:
- งานที่ผู้เข้าร่วมทำผิดและทำถูกต้อง
- หัวข้อที่ผู้เข้าร่วมทำผิดพลาด
- อันดับของเขาในหมู่ผู้เข้าสอบ
- คำอธิบายระดับของผู้เข้าร่วมตาม เช่น คำอธิบายระดับผู้เชี่ยวชาญ (ขึ้นอยู่กับคำอธิบายตำแหน่งงานว่าง)
ในระหว่างการเปิดตัวการทดสอบนำร่องของเรา เราได้แสดงรายการหัวข้อที่ต้องปรับปรุงสำหรับผู้ที่ต้องการลงทะเบียนในโปรแกรมพร้อมกับผลลัพธ์ แต่นี่ไม่เหมาะอย่างแน่นอน เราจะปรับปรุงและให้ข้อเสนอแนะที่ดีขึ้น
คราด 9: อย่าหารือเกี่ยวกับการทดสอบกับนักพัฒนา
บางทีคราดที่คมที่สุดซึ่งไม่น่าพึงใจอย่างยิ่งในการเหยียบก็คือการส่งการทดสอบคำอธิบายและระดับการให้คะแนนให้กับนักพัฒนา "ตามที่เป็นอยู่"
สิ่งที่จำเป็นต้องพูดคุยกัน:
- ลักษณะคำถาม โครงสร้าง ตำแหน่งของภาพ ตัวเลือกคำตอบที่ถูกต้องจะเป็นอย่างไร
- คะแนนคำนวณอย่างไร (หากจำเป็น) มีเงื่อนไขเพิ่มเติมหรือไม่
- ข้อเสนอแนะถูกสร้างขึ้นอย่างไร, จะรับข้อความได้ที่ไหน, มีบล็อกที่สร้างขึ้นโดยอัตโนมัติเพิ่มเติมหรือไม่
- คุณต้องรวบรวมข้อมูลเพิ่มเติมอะไรบ้างและ ณ จุดใด (ผู้ติดต่อเดียวกัน)
เพื่อหลีกเลี่ยงความเข้าใจผิด เราขอให้นักพัฒนาเขียนโค้ดคำถามที่แตกต่างกัน 2 หรือ 3 ข้อเพื่อให้พวกเขาเห็นว่ามีลักษณะอย่างไรก่อนที่จะเขียนโค้ดการทดสอบ
Rake 10: อัปโหลดโดยตรงไปยังการใช้งานจริงโดยไม่ต้องทดสอบ
3 ครั้งนะทุกคน การทดสอบควรได้รับการตรวจสอบ 3 ครั้งโดยคนละคน หรือดีกว่านั้น คนละ 3 ครั้ง ความจริงนี้ได้มาด้วยเลือด หยาดเหงื่อ และโค้ดหลายบรรทัด
การทดสอบของเราตรวจสอบสามสิ่งต่อไปนี้:
- ผลิตภัณฑ์ - ตรวจสอบการทดสอบประสิทธิภาพ ลักษณะ กลไก
- ผู้พัฒนาการทดสอบ - ตรวจสอบข้อความของงาน ลำดับ รูปแบบการทำงานกับแบบทดสอบ ประเภทของงาน คำตอบที่ถูกต้อง ความสามารถในการอ่านและการดูกราฟิกตามปกติ
- ผู้เขียนงาน (ผู้เชี่ยวชาญ) ตรวจสอบการทดสอบความเที่ยงตรงจากตำแหน่งผู้เชี่ยวชาญ
ตัวอย่างจากการปฏิบัติ: เฉพาะในการรันครั้งที่สามเท่านั้นที่ผู้เขียนงานเห็นว่ามี 1 งานยังคงอยู่ในถ้อยคำเวอร์ชันเก่า ก่อนหน้านี้ทั้งหมดก็ปกครองอย่างแข็งขันเช่นกัน แต่เมื่อการทดสอบถูกเขียนโค้ด มันดูแตกต่างไปจากที่คิดไว้ในตอนแรก มีความเป็นไปได้สูงที่บางสิ่งจะต้องได้รับการแก้ไข สิ่งนี้จะต้องนำมาพิจารณา
ทั้งหมด
เราได้สร้างสิ่งพิเศษขึ้นมาโดยหลีกเลี่ยง "คราด" เหล่านี้ทั้งหมดอย่างระมัดระวัง
คุณสามารถรับอาชีพที่เป็นที่ต้องการตั้งแต่เริ่มต้นหรือเพิ่มระดับในแง่ของทักษะและเงินเดือนโดยการเรียนหลักสูตรออนไลน์ SkillFactory:
หลักสูตรการเรียนรู้ของเครื่อง (12 สัปดาห์)หลักสูตรขั้นสูง "Machine Learning Pro + Deep Learning" (20 สัปดาห์)หลักสูตร "คณิตศาสตร์และการเรียนรู้ของเครื่องสำหรับวิทยาศาสตร์ข้อมูล" (20 สัปดาห์)สอนวิชาชีพด้าน Data Science ตั้งแต่เริ่มต้น (12 เดือน)หลักสูตรเพิ่มเติม
สอนวิชาชีพด้าน Data Science ตั้งแต่เริ่มต้น (12 เดือน)Bootcamp วิทยาศาสตร์ข้อมูลออนไลน์ (14 สัปดาห์)Bootcamp การวิเคราะห์ข้อมูลออนไลน์ (5 สัปดาห์)อาชีพนักวิเคราะห์ทุกระดับเริ่มต้น (18 เดือน)หลักสูตรการวิเคราะห์ข้อมูล (6 เดือน)หลักสูตร DevOps (12 เดือน)อาชีพนักพัฒนาเว็บ (8 เดือน)Python สำหรับหลักสูตรการพัฒนาเว็บ (9 เดือน)อาชีพ นักพัฒนา iOS ตั้งแต่เริ่มต้น (12 เดือน)นักพัฒนา Android มืออาชีพตั้งแต่เริ่มต้น (18 เดือน)นักพัฒนา Java มืออาชีพตั้งแต่เริ่มต้น (18 เดือน)หลักสูตรจาวาสคริปต์ (12 เดือน)นักออกแบบ UX มืออาชีพตั้งแต่เริ่มต้น (9 เดือน)อาชีพนักออกแบบเว็บไซต์ (7 เดือน)
ที่มา: will.com