เหตุใดทีม Data Science จึงต้องการผู้เชี่ยวชาญ ไม่ใช่ผู้เชี่ยวชาญ

เหตุใดทีม Data Science จึงต้องการผู้เชี่ยวชาญ ไม่ใช่ผู้เชี่ยวชาญ
ฮิโรชิ วาตานาเบะ/เก็ตตี้อิมเมจ

ใน The Wealth of Nations อดัม สมิธแสดงให้เห็นว่าการแบ่งงานกลายเป็นแหล่งหลักในการเพิ่มผลผลิตอย่างไร ตัวอย่างคือสายการผลิตของโรงงานเข็มหมุด: “คนงานคนหนึ่งดึงลวด อีกคนยืดลวดให้ตรง คนที่สามตัดมัน คนที่สี่ลับปลายให้คมขึ้น คนที่ห้าลับปลายอีกด้านให้พอดีกับศีรษะ” ด้วยความเชี่ยวชาญเฉพาะทางที่เน้นไปที่หน้าที่เฉพาะ พนักงานแต่ละคนจึงกลายเป็นผู้เชี่ยวชาญที่มีคุณสมบัติสูงในงานแคบๆ ของเขา ซึ่งนำไปสู่ประสิทธิภาพของกระบวนการที่เพิ่มขึ้น ผลผลิตต่อคนงานเพิ่มขึ้นหลายเท่า และโรงงานก็มีประสิทธิภาพมากขึ้นในการผลิตพิน

การแบ่งงานตามฟังก์ชันการทำงานนี้ฝังแน่นอยู่ในใจของเราแม้กระทั่งทุกวันนี้ จนเราจัดทีมของเราอย่างรวดเร็วตามนั้น วิทยาศาสตร์ข้อมูลก็ไม่มีข้อยกเว้น ความสามารถทางธุรกิจแบบอัลกอริธึมที่ซับซ้อนจำเป็นต้องมีฟังก์ชันการทำงานที่หลากหลาย ดังนั้น โดยทั่วไปบริษัทต่างๆ จึงต้องสร้างทีมผู้เชี่ยวชาญ เช่น นักวิจัย วิศวกรข้อมูล วิศวกรการเรียนรู้ของเครื่องจักร นักวิทยาศาสตร์เกี่ยวกับเหตุและผล และอื่นๆ งานของผู้เชี่ยวชาญได้รับการประสานงานโดยผู้จัดการผลิตภัณฑ์โดยมีการถ่ายโอนฟังก์ชันในลักษณะที่คล้ายกับโรงงานพิน: “คนหนึ่งได้รับข้อมูล อีกคนหนึ่งสร้างแบบจำลอง หนึ่งในสามดำเนินการ มาตรการที่สี่” และอื่นๆ

น่าเสียดายที่เราไม่ควรเพิ่มประสิทธิภาพทีม Data Science ของเราเพื่อปรับปรุงประสิทธิภาพการทำงาน อย่างไรก็ตาม คุณจะทำเช่นนี้เมื่อคุณเข้าใจสิ่งที่คุณกำลังผลิต: หมุดหรืออย่างอื่น และพยายามเพิ่มประสิทธิภาพเท่านั้น วัตถุประสงค์ของสายการประกอบคือการทำงานให้เสร็จสิ้น เรารู้ว่าเราต้องการอะไร - หมุด (ดังตัวอย่างของ Smith) แต่ผลิตภัณฑ์หรือบริการใดๆ ก็สามารถกล่าวถึงได้ โดยข้อกำหนดดังกล่าวจะอธิบายทุกแง่มุมของผลิตภัณฑ์และลักษณะการทำงานของผลิตภัณฑ์ได้ครบถ้วน บทบาทของพนักงานคือการปฏิบัติตามข้อกำหนดเหล่านี้อย่างมีประสิทธิภาพที่สุดเท่าที่จะเป็นไปได้

แต่เป้าหมายของ Data Science ไม่ใช่การทำงานให้เสร็จสิ้น แต่เป้าหมายคือการสำรวจและพัฒนาโอกาสทางธุรกิจใหม่ๆ ที่แข็งแกร่ง ผลิตภัณฑ์และบริการอัลกอริทึม เช่น ระบบการแนะนำ การโต้ตอบกับลูกค้า การจำแนกประเภทสไตล์ที่ต้องการ ขนาด การออกแบบเสื้อผ้า การเพิ่มประสิทธิภาพด้านลอจิสติกส์ การตรวจจับแนวโน้มตามฤดูกาล และอื่นๆ อีกมากมาย ไม่สามารถพัฒนาล่วงหน้าได้ พวกเขาจะต้องได้รับการศึกษา ไม่มีพิมพ์เขียวให้ทำซ้ำ สิ่งเหล่านี้คือความเป็นไปได้ใหม่ๆ ที่มีความไม่แน่นอนโดยธรรมชาติ ค่าสัมประสิทธิ์ แบบจำลอง ประเภทโมเดล ไฮเปอร์พารามิเตอร์ องค์ประกอบที่จำเป็นทั้งหมดจะต้องเรียนรู้ผ่านการทดลอง การลองผิดลองถูก และการทำซ้ำ ด้วยหมุด การฝึกอบรมและการออกแบบจึงเสร็จสิ้นก่อนการผลิต ด้วย Data Science คุณจะเรียนรู้ตามที่คุณทำ ไม่ใช่ก่อนหน้านี้

ในโรงงานพิน เมื่อการฝึกอบรมมาก่อน เราไม่คาดหวังหรือต้องการให้พนักงานปรับปรุงคุณลักษณะใดๆ ของผลิตภัณฑ์แบบด้นสด นอกเหนือจากเพื่อปรับปรุงประสิทธิภาพการผลิต งานเฉพาะทางมีความเหมาะสมเนื่องจากจะนำไปสู่ประสิทธิภาพของกระบวนการและความสม่ำเสมอในการผลิต (โดยไม่มีการเปลี่ยนแปลงกับผลิตภัณฑ์ขั้นสุดท้าย)

แต่เมื่อผลิตภัณฑ์ยังคงพัฒนาและเป้าหมายคือการฝึกอบรม ความเชี่ยวชาญพิเศษจะเข้ามาขัดขวางเป้าหมายของเราในกรณีต่อไปนี้:

1. เพิ่มค่าใช้จ่ายในการประสานงาน

นั่นคือค่าใช้จ่ายเหล่านั้นที่สะสมในช่วงเวลาที่ใช้ในการสื่อสาร อภิปราย ให้เหตุผล และจัดลำดับความสำคัญของงานที่ต้องทำ ต้นทุนเหล่านี้ขยายเป็นเส้นตรงมากตามจำนวนคนที่เกี่ยวข้อง (ดังที่เจ. ริชาร์ด แฮ็กแมนสอนเรา จำนวนความสัมพันธ์ r เพิ่มขึ้นคล้ายกับฟังก์ชันของจำนวนพจน์ n ตามสมการนี้: r = (n^2-n)/2 และความสัมพันธ์แต่ละอย่างเผยให้เห็นบางส่วนของความสัมพันธ์ ความสัมพันธ์ด้านต้นทุน) เมื่อนักวิทยาศาสตร์ข้อมูลได้รับการจัดระเบียบตามหน้าที่ ในทุกขั้นตอน ทุกการเปลี่ยนแปลง ทุกการส่งมอบ ฯลฯ จำเป็นต้องมีผู้เชี่ยวชาญจำนวนมาก ซึ่งเพิ่มค่าใช้จ่ายในการประสานงาน ตัวอย่างเช่น ผู้สร้างแบบจำลองทางสถิติที่ต้องการทดลองใช้คุณลักษณะใหม่ๆ จะต้องประสานงานกับวิศวกรข้อมูลที่เพิ่มลงในชุดข้อมูลทุกครั้งที่ต้องการลองสิ่งใหม่ๆ ในทำนองเดียวกัน โมเดลใหม่แต่ละโมเดลที่ได้รับการฝึกหมายความว่านักพัฒนาโมเดลจะต้องการใครสักคนที่จะประสานงานด้วยเพื่อนำไปใช้งานจริง ค่าใช้จ่ายในการประสานงานทำหน้าที่เป็นราคาสำหรับการทำซ้ำ ทำให้ยากขึ้นและมีค่าใช้จ่ายสูง และมีแนวโน้มที่จะทำให้การศึกษาถูกยกเลิกมากขึ้น สิ่งนี้อาจรบกวนการเรียนรู้

2. ทำให้การรอคอยทำได้ยาก

สิ่งที่น่ากังวลยิ่งกว่าค่าใช้จ่ายในการประสานงานคือเวลาที่เสียไประหว่างกะทำงาน แม้ว่าค่าใช้จ่ายในการประสานงานมักจะวัดเป็นชั่วโมง แต่เวลาที่ใช้ในการจัดการประชุม อภิปราย ทบทวนการออกแบบ แต่เวลาในการรอมักจะวัดเป็นวัน สัปดาห์ หรือกระทั่งเดือน! กำหนดการของผู้เชี่ยวชาญเฉพาะด้านเป็นเรื่องยากที่จะจัดสมดุล เนื่องจากผู้เชี่ยวชาญแต่ละคนต้องกระจายไปยังหลายโครงการ การประชุมหนึ่งชั่วโมงเพื่อหารือเกี่ยวกับการเปลี่ยนแปลงอาจใช้เวลาหลายสัปดาห์เพื่อทำให้ขั้นตอนการทำงานราบรื่น และหลังจากตกลงเปลี่ยนแปลงแล้วจำเป็นต้องวางแผนงานจริงในบริบทของโครงการอื่น ๆ อีกมากมายที่ใช้เวลาทำงานของผู้เชี่ยวชาญ งานที่เกี่ยวข้องกับการแก้ไขโค้ดหรือการวิจัยที่ใช้เวลาเพียงไม่กี่ชั่วโมงหรือหลายวันจึงจะเสร็จสมบูรณ์อาจใช้เวลานานกว่ามากก่อนที่ทรัพยากรจะพร้อมใช้งาน จนกว่าจะถึงตอนนั้น การวนซ้ำและการเรียนรู้จะถูกระงับ

3. ทำให้บริบทแคบลง

การแบ่งงานสามารถจำกัดการเรียนรู้โดยให้รางวัลแก่ผู้คนที่ยังคงรักษาความสามารถพิเศษของตนไว้ได้ ตัวอย่างเช่น นักวิทยาศาสตร์การวิจัยที่ต้องอยู่ภายในขอบเขตของฟังก์ชันการทำงานของเขาจะมุ่งความสนใจไปที่การทดลองกับอัลกอริธึมประเภทต่างๆ เช่น การถดถอย โครงข่ายประสาทเทียม ฟอเรสต์สุ่ม และอื่นๆ แน่นอนว่า ตัวเลือกอัลกอริธึมที่ดีสามารถนำไปสู่การปรับปรุงที่เพิ่มขึ้นได้ แต่โดยทั่วไปแล้ว กิจกรรมอื่นๆ จะได้รับอะไรอีกมากมาย เช่น การรวมแหล่งข้อมูลใหม่ ในทำนองเดียวกัน มันจะช่วยพัฒนาแบบจำลองที่ใช้ประโยชน์จากพลังการอธิบายทุกส่วนที่มีอยู่ในข้อมูล อย่างไรก็ตาม จุดแข็งของมันอาจอยู่ที่การเปลี่ยนฟังก์ชันวัตถุประสงค์หรือผ่อนคลายข้อจำกัดบางประการ นี่เป็นเรื่องยากที่จะเห็นหรือทำเมื่องานของเธอมีจำกัด เนื่องจากนักวิทยาศาสตร์ทางเทคนิคเชี่ยวชาญในการปรับอัลกอริทึมให้เหมาะสม เขาจึงมีโอกาสน้อยมากที่จะดำเนินการอย่างอื่น แม้ว่าจะก่อให้เกิดประโยชน์มากมายก็ตาม

ในการตั้งชื่อสัญญาณที่ปรากฏขึ้นเมื่อทีมวิทยาศาสตร์ข้อมูลทำหน้าที่เป็นโรงงานปักหมุด (เช่น ในการอัปเดตสถานะแบบธรรมดา): “การรอการเปลี่ยนแปลงไปป์ไลน์ข้อมูล” และ “การรอทรัพยากร ML Eng” เป็นตัวบล็อกทั่วไป อย่างไรก็ตาม ฉันเชื่อว่าอิทธิพลที่อันตรายกว่านั้นคือสิ่งที่คุณไม่สังเกตเห็น เพราะคุณไม่สามารถเสียใจในสิ่งที่คุณไม่รู้ได้ การดำเนินการที่ไร้ที่ติและความพึงพอใจที่ได้รับจากการบรรลุประสิทธิภาพของกระบวนการสามารถปกปิดความจริงที่ว่าองค์กรต่างๆ ไม่ทราบถึงประโยชน์การฝึกอบรมที่พวกเขาพลาดไป

แน่นอนว่าวิธีแก้ปัญหานี้คือการกำจัดวิธีปักหมุดจากโรงงาน เพื่อส่งเสริมการเรียนรู้และการทำซ้ำ บทบาทของนักวิทยาศาสตร์ข้อมูลควรเป็นแบบทั่วไปแต่มีความรับผิดชอบกว้างๆ โดยไม่ขึ้นอยู่กับหน้าที่ทางเทคนิค เช่น จัดระเบียบนักวิทยาศาสตร์ข้อมูลเพื่อให้เหมาะสำหรับการเรียนรู้ นี่หมายถึงการจ้าง "ผู้เชี่ยวชาญแบบฟูลสแตก" ซึ่งเป็นผู้เชี่ยวชาญทั่วไปที่สามารถทำหน้าที่ได้หลากหลาย ตั้งแต่แนวคิดไปจนถึงการสร้างแบบจำลอง การนำไปปฏิบัติและการวัดผล สิ่งสำคัญที่ควรทราบก็คือ ฉันไม่ได้แนะนำว่าการจ้างผู้มีความสามารถเต็มรูปแบบควรลดจำนวนพนักงานลง แต่ฉันแค่จะถือว่าเมื่อมีการจัดระเบียบที่แตกต่างกัน สิ่งจูงใจของพวกเขาจะสอดคล้องกับประโยชน์ของการเรียนรู้และผลการปฏิบัติงานมากกว่า ตัวอย่างเช่น สมมติว่าคุณมีทีมสามคนที่มีทักษะทางธุรกิจสามประการ ในโรงงานพิน ช่างเทคนิคแต่ละคนจะทุ่มเทเวลาหนึ่งในสามให้กับงานแต่ละงาน เนื่องจากไม่มีใครสามารถทำงานของเขาได้ โดยรวมแล้ว ผู้เชี่ยวชาญทั่วไปแต่ละคนทุ่มเทให้กับกระบวนการทางธุรกิจทั้งหมด การขยายขนาด และการฝึกอบรมอย่างเต็มที่

เมื่อมีคนสนับสนุนวงจรการผลิตน้อยลง การประสานงานก็ลดลง ผู้สรุปทั่วไปจะสลับไปมาระหว่างฟีเจอร์ต่างๆ อย่างลื่นไหล ขยายไปป์ไลน์ข้อมูลเพื่อเพิ่มข้อมูลเพิ่มเติม ลองใช้ฟีเจอร์ใหม่ๆ ในโมเดล ปรับใช้เวอร์ชันใหม่ในการใช้งานจริงสำหรับการวัดเชิงสาเหตุ และทำซ้ำขั้นตอนทันทีที่มีแนวคิดใหม่ๆ เกิดขึ้น แน่นอนว่าสเตชั่นแวกอนจะทำหน้าที่ต่างๆ ตามลำดับและไม่ได้ทำงานแบบขนาน สุดท้ายก็เป็นเพียงคนคนหนึ่ง อย่างไรก็ตาม การทำงานให้เสร็จสิ้นมักจะใช้เวลาเพียงเศษเสี้ยวของเวลาที่จำเป็นในการเข้าถึงทรัพยากรเฉพาะทางอื่นๆ ดังนั้นเวลาในการทำซ้ำจึงลดลง

ผู้เชี่ยวชาญทั่วไปของเราอาจไม่มีทักษะเท่ากับผู้เชี่ยวชาญในหน้าที่การงานใดงานหนึ่ง แต่เราไม่ได้มุ่งมั่นเพื่อความสมบูรณ์แบบในการทำงานหรือการปรับปรุงเพิ่มเติมเล็กน้อย แต่เรามุ่งมั่นที่จะเรียนรู้และค้นพบความท้าทายทางวิชาชีพมากขึ้นเรื่อยๆ โดยมีผลกระทบทีละน้อย ด้วยบริบทแบบองค์รวมสำหรับโซลูชันที่สมบูรณ์ เขามองเห็นโอกาสที่ผู้เชี่ยวชาญจะพลาดไป เขามีความคิดและความเป็นไปได้มากขึ้น เขาก็ล้มเหลวเช่นกัน อย่างไรก็ตาม ต้นทุนของความล้มเหลวนั้นต่ำและประโยชน์ของการเรียนรู้ก็สูง ความไม่สมดุลนี้ส่งเสริมการทำซ้ำอย่างรวดเร็วและให้รางวัลการเรียนรู้

สิ่งสำคัญคือต้องทราบว่าปริมาณความเป็นอิสระและความหลากหลายของทักษะที่นักวิทยาศาสตร์สามารถจ่ายได้นั้นส่วนใหญ่ขึ้นอยู่กับความแข็งแกร่งของแพลตฟอร์มข้อมูลที่ใช้งานได้ แพลตฟอร์มข้อมูลที่ได้รับการออกแบบมาอย่างดีจะทำให้นักวิทยาศาสตร์ข้อมูลสรุปความซับซ้อนของคอนเทนเนอร์ การประมวลผลแบบกระจาย เฟลโอเวอร์อัตโนมัติ และแนวคิดการประมวลผลขั้นสูงอื่นๆ นอกเหนือจากนามธรรมแล้ว แพลตฟอร์มข้อมูลที่แข็งแกร่งยังสามารถให้การเชื่อมต่อที่ราบรื่นกับโครงสร้างพื้นฐานการทดลอง ทำให้การตรวจสอบและการแจ้งเตือนเป็นแบบอัตโนมัติ ช่วยให้สามารถปรับขนาดอัตโนมัติและแสดงภาพผลลัพธ์ของอัลกอริทึมและการดีบักได้ ส่วนประกอบเหล่านี้ได้รับการออกแบบและสร้างโดยวิศวกรแพลตฟอร์มข้อมูล ซึ่งหมายความว่าจะไม่ส่งต่อจากนักวิทยาศาสตร์ข้อมูลไปยังทีมพัฒนาแพลตฟอร์มข้อมูล เป็นผู้เชี่ยวชาญด้าน Data Science ที่รับผิดชอบโค้ดทั้งหมดที่ใช้ในการรันแพลตฟอร์ม

ครั้งหนึ่งฉันเองก็เคยสนใจในการแบ่งตามหน้าที่ของแรงงานโดยใช้ประสิทธิภาพของกระบวนการ แต่ผ่านการลองผิดลองถูก (ไม่มีวิธีการเรียนรู้ที่ดีไปกว่านี้) ฉันค้นพบว่าบทบาททั่วไปเอื้อต่อการเรียนรู้และนวัตกรรมได้ดีกว่า และให้ตัวชี้วัดที่เหมาะสม: การค้นพบและ สร้างโอกาสทางธุรกิจมากกว่าแนวทางเฉพาะทาง (วิธีที่มีประสิทธิภาพมากกว่าในการเรียนรู้เกี่ยวกับวิธีการจัดระเบียบนี้มากกว่าการลองผิดลองถูกที่ฉันเคยทำคือการอ่านหนังสือ Team Collaboration: How Organizations Learn, Innovate and Compete in the Knowledge Economy ของ Amy Edmondson)

มีข้อสันนิษฐานที่สำคัญบางประการที่อาจทำให้วิธีการจัดระเบียบนี้น่าเชื่อถือไม่มากก็น้อยในบางบริษัท กระบวนการทำซ้ำช่วยลดต้นทุนของการลองผิดลองถูก หากต้นทุนของข้อผิดพลาดสูง คุณอาจต้องการลดข้อผิดพลาดเหล่านี้ (แต่ไม่แนะนำสำหรับการใช้งานทางการแพทย์หรือการผลิต) นอกจากนี้ หากคุณกำลังจัดการกับข้อมูลขนาดเพตะไบต์หรือเอ็กซาไบต์ อาจจำเป็นต้องมีความเชี่ยวชาญด้านวิศวกรรมข้อมูล ในทำนองเดียวกัน หากการรักษาความสามารถทางธุรกิจออนไลน์และความพร้อมใช้งานมีความสำคัญมากกว่าการปรับปรุง ความเป็นเลิศด้านฟังก์ชันอาจสำคัญกว่าการเรียนรู้ สุดท้าย Full Stack Model ขึ้นอยู่กับความคิดเห็นของผู้รู้เกี่ยวกับมัน พวกเขาไม่ใช่ยูนิคอร์น คุณสามารถหามันหรือเตรียมมันเองได้ อย่างไรก็ตาม สิ่งเหล่านี้เป็นที่ต้องการสูง และการดึงดูดและรักษาไว้นั้นจะต้องอาศัยค่าตอบแทนที่แข่งขันได้ ค่านิยมองค์กรที่แข็งแกร่ง และงานที่ท้าทาย ตรวจสอบให้แน่ใจว่าวัฒนธรรมบริษัทของคุณสามารถสนับสนุนสิ่งนี้ได้

แม้จะกล่าวมาทั้งหมดแล้ว ฉันเชื่อว่าโมเดลสแต็กเต็มให้เงื่อนไขการเริ่มต้นที่ดีที่สุด เริ่มต้นด้วยพวกเขา จากนั้นจงมุ่งไปสู่การแบ่งหน้าที่การทำงานอย่างมีสติเฉพาะเมื่อจำเป็นจริงๆ เท่านั้น

มีข้อเสียอื่น ๆ ของความเชี่ยวชาญเฉพาะทาง สิ่งนี้สามารถนำไปสู่การสูญเสียความรับผิดชอบและความเฉื่อยชาของพนักงานได้ สมิธเองก็วิพากษ์วิจารณ์การแบ่งงาน โดยบอกว่ามันนำไปสู่การลดความสามารถ เช่น คนงานกลายเป็นคนโง่เขลาและถอนตัวออกไปเนื่องจากบทบาทของพวกเขาถูกจำกัดอยู่เพียงงานซ้ำๆ สองสามงาน แม้ว่าความเชี่ยวชาญเฉพาะทางอาจให้ประสิทธิภาพของกระบวนการ แต่ก็มีโอกาสน้อยที่จะสร้างแรงบันดาลใจให้กับพนักงาน

ในทางกลับกัน บทบาทที่หลากหลายจะมอบทุกสิ่งที่ขับเคลื่อนความพึงพอใจในงาน: ความเป็นอิสระ ความเชี่ยวชาญ และวัตถุประสงค์ เอกราชคือพวกเขาไม่ได้พึ่งพาสิ่งใดๆ เพื่อให้บรรลุความสำเร็จ ความเชี่ยวชาญอยู่ที่ข้อได้เปรียบทางการแข่งขันที่แข็งแกร่ง และความรู้สึกถึงจุดมุ่งหมายอยู่ที่โอกาสที่จะสร้างผลกระทบต่อธุรกิจที่พวกเขาสร้างขึ้น ถ้าเราสามารถทำให้ผู้คนรู้สึกตื่นเต้นกับงานของพวกเขาและมีผลกระทบอย่างมากต่อบริษัท ทุกอย่างก็จะเข้าที่เข้าทาง

ที่มา: will.com

เพิ่มความคิดเห็น