Γιατί οι ομάδες Επιστήμης Δεδομένων χρειάζονται γενικούς, όχι ειδικούς

Γιατί οι ομάδες Επιστήμης Δεδομένων χρειάζονται γενικούς, όχι ειδικούς
HIROSHI WATANABE/GETTY IMAGES

Στο The Wealth of Nations, ο Adam Smith δείχνει πώς ο καταμερισμός της εργασίας γίνεται η κύρια πηγή αυξημένης παραγωγικότητας. Ένα παράδειγμα είναι η γραμμή συναρμολόγησης ενός εργοστασίου καρφίτσας: «Ένας εργάτης τραβάει το σύρμα, ένας άλλος το ισιώνει, ένας τρίτος το κόβει, ένας τέταρτος ακονίζει το άκρο, ένας πέμπτος αλέθει το άλλο άκρο για να χωρέσει το κεφάλι». Χάρη στην εξειδίκευση που επικεντρώνεται σε συγκεκριμένες λειτουργίες, κάθε εργαζόμενος γίνεται ειδικός υψηλής ειδίκευσης στο στενό έργο του, γεγονός που οδηγεί σε αυξημένη αποτελεσματικότητα της διαδικασίας. Η παραγωγή ανά εργαζόμενο αυξάνεται πολλές φορές και το εργοστάσιο γίνεται πιο αποτελεσματικό στην παραγωγή ακίδων.

Αυτός ο καταμερισμός εργασίας ανά λειτουργικότητα είναι τόσο ριζωμένος στο μυαλό μας ακόμα και σήμερα που οργανώσαμε γρήγορα τις ομάδες μας ανάλογα. Η Επιστήμη Δεδομένων δεν αποτελεί εξαίρεση. Οι σύνθετες αλγοριθμικές επιχειρηματικές δυνατότητες απαιτούν πολλαπλές λειτουργίες εργασίας, επομένως οι εταιρείες δημιουργούν συνήθως ομάδες ειδικών: ερευνητές, μηχανικούς δεδομένων, μηχανικούς μηχανικής μάθησης, επιστήμονες αιτίας και αποτελέσματος και ούτω καθεξής. Το έργο των ειδικών συντονίζεται από τον υπεύθυνο προϊόντων με τη μεταφορά λειτουργιών με τρόπο που μοιάζει με εργοστάσιο καρφίτσας: "ένα άτομο λαμβάνει τα δεδομένα, ένα άλλο τα μοντελοποιεί, ένα τρίτο τα εκτελεί, ένα τέταρτο μέτρα" και ούτω καθεξής,

Δυστυχώς, δεν πρέπει να βελτιστοποιήσουμε τις ομάδες Επιστήμης Δεδομένων μας για να βελτιώσουμε την παραγωγικότητα. Ωστόσο, το κάνετε αυτό όταν καταλαβαίνετε τι παράγετε: καρφίτσες ή κάτι άλλο, και απλώς προσπαθείτε να αυξήσετε την απόδοση. Ο σκοπός των γραμμών συναρμολόγησης είναι να ολοκληρώσουν μια εργασία. Ξέρουμε ακριβώς τι θέλουμε - καρφίτσες (όπως στο παράδειγμα του Smith), αλλά μπορεί να αναφερθεί οποιοδήποτε προϊόν ή υπηρεσία όπου οι απαιτήσεις περιγράφουν πλήρως όλες τις πτυχές του προϊόντος και τη συμπεριφορά του. Ο ρόλος των εργαζομένων είναι να εκπληρώσουν αυτές τις απαιτήσεις όσο το δυνατόν πιο αποτελεσματικά.

Αλλά ο στόχος της Επιστήμης Δεδομένων δεν είναι να ολοκληρώσει εργασίες. Αντίθετα, ο στόχος είναι η εξερεύνηση και η ανάπτυξη ισχυρών νέων επιχειρηματικών ευκαιριών. Αλγοριθμικά προϊόντα και υπηρεσίες όπως συστήματα συστάσεων, αλληλεπιδράσεις με πελάτες, ταξινόμηση προτιμήσεων στυλ, μέγεθος, σχεδιασμός ρούχων, βελτιστοποίηση logistics, ανίχνευση εποχιακών τάσεων και πολλά άλλα δεν μπορούν να αναπτυχθούν εκ των προτέρων. Πρέπει να μελετηθούν. Δεν υπάρχουν σχέδια για αναπαραγωγή, αυτές είναι νέες δυνατότητες με εγγενή αβεβαιότητα. Οι συντελεστές, τα μοντέλα, οι τύποι μοντέλων, οι υπερπαράμετροι, όλα τα απαραίτητα στοιχεία πρέπει να μαθαίνονται μέσω πειραματισμού, δοκιμής και λάθους και επανάληψης. Με καρφίτσες, η εκπαίδευση και ο σχεδιασμός γίνονται πριν από την παραγωγή. Με την Επιστήμη Δεδομένων, μαθαίνετε όπως μαθαίνετε, όχι πριν.

Σε ένα εργοστάσιο καρφιτσών, όταν η εκπαίδευση έρχεται πρώτη, ούτε περιμένουμε ούτε θέλουμε οι εργαζόμενοι να αυτοσχεδιάσουν σε οποιοδήποτε χαρακτηριστικό του προϊόντος εκτός από τη βελτίωση της αποδοτικότητας της παραγωγής. Η εξειδίκευση των εργασιών έχει νόημα επειδή οδηγεί σε αποτελεσματικότητα της διαδικασίας και συνέπεια παραγωγής (χωρίς αλλαγές στο τελικό προϊόν).

Αλλά όταν το προϊόν εξακολουθεί να αναπτύσσεται και ο στόχος είναι η εκπαίδευση, η εξειδίκευση παρεμβαίνει στους στόχους μας στις ακόλουθες περιπτώσεις:

1. Αυξάνει το κόστος συντονισμού.

Δηλαδή, εκείνα τα κόστη που συσσωρεύονται κατά τη διάρκεια του χρόνου που αφιερώνεται στην επικοινωνία, τη συζήτηση, την αιτιολόγηση και την ιεράρχηση της δουλειάς που πρέπει να γίνει. Αυτά τα κόστη κλιμακώνονται υπερ-γραμμικά ανάλογα με τον αριθμό των ατόμων που συμμετέχουν. (Όπως μας δίδαξε ο J. Richard Hackman, ο αριθμός των σχέσεων r αυξάνεται παρόμοια με τη συνάρτηση του αριθμού των όρων n σύμφωνα με αυτήν την εξίσωση: r = (n^2-n)/2. Και κάθε σχέση αποκαλύπτει κάποιο ποσό σχέση κόστους.) Όταν οι επιστήμονες δεδομένων οργανώνονται ανά λειτουργία, σε κάθε στάδιο, με κάθε αλλαγή, κάθε παράδοση κ.λπ., απαιτούνται πολλοί ειδικοί, γεγονός που αυξάνει το κόστος συντονισμού. Για παράδειγμα, οι στατιστικοί μοντελιστές που θέλουν να πειραματιστούν με νέα χαρακτηριστικά θα πρέπει να συντονιστούν με μηχανικούς δεδομένων που προσθέτουν στα σύνολα δεδομένων κάθε φορά που θέλουν να δοκιμάσουν κάτι νέο. Ομοίως, κάθε νέο μοντέλο που εκπαιδεύεται σημαίνει ότι ο προγραμματιστής του μοντέλου θα χρειαστεί κάποιον να συντονιστεί για να το βάλει στην παραγωγή. Το κόστος συντονισμού λειτουργεί ως τιμή για την επανάληψη, καθιστώντας το πιο δύσκολο και δαπανηρό και πιο πιθανό να προκαλέσει την εγκατάλειψη της μελέτης. Αυτό μπορεί να επηρεάσει τη μάθηση.

2. Κάνει δύσκολους χρόνους αναμονής.

Ακόμη πιο τρομακτικό από το κόστος συντονισμού είναι ο χρόνος που χάνεται μεταξύ των βάρδιων εργασίας. Ενώ το κόστος συντονισμού συνήθως μετριέται σε ώρες - ο χρόνος που απαιτείται για τη διεξαγωγή συναντήσεων, συζητήσεων, αναθεωρήσεων σχεδιασμού - ο χρόνος αναμονής συνήθως μετράται σε ημέρες, εβδομάδες ή και μήνες! Τα χρονοδιαγράμματα των λειτουργικών ειδικών είναι δύσκολο να εξισορροπηθούν επειδή κάθε ειδικός πρέπει να κατανέμεται σε πολλά έργα. Μια συνάντηση μιας ώρας για να συζητηθούν οι αλλαγές μπορεί να διαρκέσει εβδομάδες για να εξομαλύνει τη ροή εργασίας. Και αφού συμφωνήσετε για τις αλλαγές, είναι απαραίτητο να προγραμματιστεί η ίδια η πραγματική εργασία στο πλαίσιο πολλών άλλων έργων που καταλαμβάνουν το χρόνο εργασίας των ειδικών. Οι εργασίες που περιλαμβάνουν διορθώσεις κώδικα ή έρευνα που χρειάζονται μόνο λίγες ώρες ή ημέρες για να ολοκληρωθούν ενδέχεται να διαρκέσουν πολύ περισσότερο πριν γίνουν διαθέσιμοι πόροι. Μέχρι τότε, η επανάληψη και η εκμάθηση αναστέλλονται.

3. Περιορίζει το πλαίσιο.

Ο καταμερισμός της εργασίας μπορεί να περιορίσει τεχνητά τη μάθηση επιβραβεύοντας τους ανθρώπους για την παραμονή τους στην ειδικότητά τους. Για παράδειγμα, ένας ερευνητής επιστήμονας που πρέπει να παραμείνει εντός του πεδίου της λειτουργικότητάς του θα εστιάσει την ενέργειά του στον πειραματισμό με διαφορετικούς τύπους αλγορίθμων: παλινδρόμηση, νευρωνικά δίκτυα, τυχαίο δάσος κ.λπ. Φυσικά, οι καλές επιλογές αλγορίθμων μπορούν να οδηγήσουν σε σταδιακές βελτιώσεις, αλλά συνήθως υπάρχουν πολλά περισσότερα που μπορούμε να κερδίσουμε από άλλες δραστηριότητες, όπως η ενσωμάτωση νέων πηγών δεδομένων. Ομοίως, θα βοηθήσει στην ανάπτυξη ενός μοντέλου που θα εκμεταλλεύεται κάθε κομμάτι της επεξηγηματικής δύναμης που είναι εγγενής στα δεδομένα. Ωστόσο, η δύναμή του μπορεί να βρίσκεται στην αλλαγή της αντικειμενικής συνάρτησης ή στη χαλάρωση ορισμένων περιορισμών. Αυτό είναι δύσκολο να το δεις ή να το κάνεις όταν η δουλειά της είναι περιορισμένη. Επειδή ένας τεχνικός επιστήμονας ειδικεύεται στη βελτιστοποίηση αλγορίθμων, είναι πολύ λιγότερο πιθανό να κάνει οτιδήποτε άλλο, ακόμα κι αν αυτό αποφέρει σημαντικά οφέλη.

Για να ονομάσετε τα σημάδια που εμφανίζονται όταν οι ομάδες επιστήμης δεδομένων ενεργούν ως εργοστάσια καρφίτσας (για παράδειγμα, σε απλές ενημερώσεις κατάστασης): η "αναμονή για αλλαγές στη γραμμή δεδομένων" και η "αναμονή για πόρους ML Eng" είναι συνήθεις αποκλειστές. Ωστόσο, πιστεύω ότι η πιο επικίνδυνη επιρροή είναι αυτό που δεν παρατηρείς, γιατί δεν μπορείς να μετανιώσεις για αυτό που δεν ξέρεις ήδη. Η άψογη εκτέλεση και ο εφησυχασμός που αποκτάται από την επίτευξη της αποτελεσματικότητας της διαδικασίας μπορούν να κρύψουν την αλήθεια ότι οι οργανισμοί δεν γνωρίζουν τα μαθησιακά οφέλη που χάνουν.

Η λύση σε αυτό το πρόβλημα, φυσικά, είναι να απαλλαγούμε από τη μέθοδο εργοστασιακής καρφίτσας. Για να ενθαρρυνθεί η μάθηση και η επανάληψη, οι ρόλοι των επιστημόνων δεδομένων θα πρέπει να είναι γενικοί αλλά με ευρείες ευθύνες ανεξάρτητες από την τεχνική λειτουργία, δηλαδή να οργανώνουν τους επιστήμονες δεδομένων έτσι ώστε να βελτιστοποιούνται για μάθηση. Αυτό σημαίνει πρόσληψη «ειδικών πλήρους στοίβας»—γενικών ειδικών που μπορούν να επιτελούν ποικίλες λειτουργίες, από την ιδέα έως τη μοντελοποίηση, την υλοποίηση έως τη μέτρηση. Είναι σημαντικό να σημειωθεί ότι δεν προτείνω ότι η πρόσληψη ταλέντων σε πλήρη στοίβα θα πρέπει να μειώσει τον αριθμό των εργαζομένων. Αντίθετα, θα υποθέσω απλώς ότι όταν οργανώνονται διαφορετικά, τα κίνητρά τους ευθυγραμμίζονται καλύτερα με τα οφέλη μάθησης και απόδοσης. Για παράδειγμα, ας υποθέσουμε ότι έχετε μια ομάδα τριών ατόμων με τρεις επιχειρηματικές δεξιότητες. Σε ένα εργοστάσιο καρφίτσας, κάθε τεχνικός θα αφιερώσει το ένα τρίτο του χρόνου του σε κάθε εργασία, αφού κανείς άλλος δεν μπορεί να κάνει τη δουλειά του. Σε μια πλήρη στοίβα, κάθε γενικός υπάλληλος είναι πλήρως αφοσιωμένος σε ολόκληρη την επιχειρηματική διαδικασία, την κλιμάκωση και την εκπαίδευση.

Με λιγότερα άτομα να υποστηρίζουν τον κύκλο παραγωγής, ο συντονισμός μειώνεται. Ο γενικός κινείται ρευστά μεταξύ των χαρακτηριστικών, επεκτείνοντας τη γραμμή δεδομένων για να προσθέσει περισσότερα δεδομένα, δοκιμάζοντας νέες δυνατότητες σε μοντέλα, αναπτύσσοντας νέες εκδόσεις στην παραγωγή για αιτιώδεις μετρήσεις και επαναλαμβάνοντας βήματα μόλις προκύψουν νέες ιδέες. Φυσικά, το station wagon εκτελεί διαφορετικές λειτουργίες διαδοχικά και όχι παράλληλα. Άλλωστε, είναι μόνο ένα άτομο. Ωστόσο, η ολοκλήρωση μιας εργασίας συνήθως απαιτεί μόνο ένα κλάσμα του χρόνου που απαιτείται για την πρόσβαση σε έναν άλλο εξειδικευμένο πόρο. Έτσι, ο χρόνος επανάληψης μειώνεται.

Ο γενικός μας γιατρός μπορεί να μην είναι τόσο ικανός όσο ένας ειδικός σε μια συγκεκριμένη εργασία, αλλά δεν προσπαθούμε για λειτουργική τελειότητα ή μικρές σταδιακές βελτιώσεις. Αντίθετα, προσπαθούμε να μαθαίνουμε και να ανακαλύπτουμε όλο και περισσότερες επαγγελματικές προκλήσεις με σταδιακό αντίκτυπο. Με ένα ολιστικό πλαίσιο για μια ολοκληρωμένη λύση, βλέπει ευκαιρίες που θα έχανε ένας ειδικός. Έχει περισσότερες ιδέες και περισσότερες δυνατότητες. Αποτυγχάνει κι αυτός. Ωστόσο, το κόστος της αποτυχίας είναι χαμηλό και τα οφέλη της μάθησης είναι υψηλά. Αυτή η ασυμμετρία προωθεί την ταχεία επανάληψη και ανταμείβει τη μάθηση.

Είναι σημαντικό να σημειωθεί ότι η ποσότητα της αυτονομίας και της ποικιλομορφίας δεξιοτήτων που παρέχεται στους επιστήμονες με πλήρη στοίβα εξαρτάται σε μεγάλο βαθμό από την ευρωστία της πλατφόρμας δεδομένων στην οποία θα εργαστούν. Μια καλά σχεδιασμένη πλατφόρμα δεδομένων αφαιρεί τους επιστήμονες δεδομένων από την πολυπλοκότητα της αποθήκευσης, της κατανεμημένης επεξεργασίας, της αυτόματης ανακατεύθυνσης και άλλων προηγμένων υπολογιστικών εννοιών. Εκτός από την αφαίρεση, μια ισχυρή πλατφόρμα δεδομένων μπορεί να παρέχει απρόσκοπτη συνδεσιμότητα με πειραματική υποδομή, να αυτοματοποιήσει την παρακολούθηση και την ειδοποίηση, να επιτρέψει την αυτόματη κλιμάκωση και οπτικοποίηση των αλγοριθμικών αποτελεσμάτων και τον εντοπισμό σφαλμάτων. Αυτά τα στοιχεία σχεδιάζονται και κατασκευάζονται από τους μηχανικούς της πλατφόρμας δεδομένων, πράγμα που σημαίνει ότι δεν μεταβιβάζονται από τον επιστήμονα δεδομένων στην ομάδα ανάπτυξης της πλατφόρμας δεδομένων. Είναι ο ειδικός της Επιστήμης Δεδομένων που είναι υπεύθυνος για όλο τον κώδικα που χρησιμοποιείται για την εκτέλεση της πλατφόρμας.

Και εγώ κάποτε με ενδιέφερε ο λειτουργικός καταμερισμός της εργασίας χρησιμοποιώντας την αποτελεσματικότητα της διαδικασίας, αλλά μέσω δοκιμής και λάθους (δεν υπάρχει καλύτερος τρόπος μάθησης), ανακάλυψα ότι οι τυπικοί ρόλοι διευκολύνουν καλύτερα τη μάθηση και την καινοτομία και παρέχουν τις σωστές μετρήσεις: ανακάλυψη και δημιουργία πολλών περισσότερων επιχειρηματικών ευκαιριών από εξειδικευμένη προσέγγιση. (Ένας πιο αποτελεσματικός τρόπος για να μάθετε για αυτήν την προσέγγιση οργάνωσης από τη δοκιμή και το σφάλμα που πέρασα είναι να διαβάσετε το βιβλίο της Amy Edmondson Team Collaboration: How Organizations Learn, Innovate, and Compete in the Knowledge Economy).

Υπάρχουν ορισμένες σημαντικές υποθέσεις που μπορεί να κάνουν αυτήν την προσέγγιση για την οργάνωση περισσότερο ή λιγότερο αξιόπιστη σε ορισμένες εταιρείες. Η διαδικασία επανάληψης μειώνει το κόστος δοκιμής και λάθους. Εάν το κόστος του σφάλματος είναι υψηλό, μπορεί να θέλετε να το μειώσετε (αλλά αυτό δεν συνιστάται για ιατρικές εφαρμογές ή κατασκευή). Επιπλέον, εάν έχετε να κάνετε με petabyte ή exabyte δεδομένων, μπορεί να απαιτείται εξειδίκευση στη μηχανική δεδομένων. Ομοίως, εάν η διατήρηση των διαδικτυακών επιχειρηματικών δυνατοτήτων και της διαθεσιμότητάς τους είναι πιο σημαντική από τη βελτίωσή τους, η λειτουργική αριστεία μπορεί να υπερισχύει της μάθησης. Τέλος, το μοντέλο πλήρους στοίβας βασίζεται στις απόψεις των ανθρώπων που το γνωρίζουν. Δεν είναι μονόκεροι. μπορείτε να τα βρείτε ή να τα ετοιμάσετε μόνοι σας. Ωστόσο, έχουν μεγάλη ζήτηση και η προσέλκυση και η διατήρησή τους θα απαιτήσει ανταγωνιστική αποζημίωση, ισχυρές εταιρικές αξίες και απαιτητική εργασία. Βεβαιωθείτε ότι η εταιρική σας κουλτούρα μπορεί να το υποστηρίξει.

Ακόμη και με όλα αυτά που αναφέρθηκαν, πιστεύω ότι το μοντέλο full stack παρέχει τις καλύτερες συνθήκες εκκίνησης. Ξεκινήστε με αυτά και στη συνέχεια προχωρήστε συνειδητά προς έναν λειτουργικό καταμερισμό εργασίας μόνο όταν είναι απολύτως απαραίτητο.

Υπάρχουν και άλλα μειονεκτήματα της λειτουργικής εξειδίκευσης. Αυτό μπορεί να οδηγήσει σε απώλεια ευθύνης και παθητικότητα εκ μέρους των εργαζομένων. Ο ίδιος ο Smith επικρίνει τον καταμερισμό της εργασίας, προτείνοντας ότι οδηγεί σε εξασθένιση του ταλέντου, δηλ. Οι εργαζόμενοι γίνονται αδαείς και αποσύρονται καθώς οι ρόλοι τους περιορίζονται σε μερικές επαναλαμβανόμενες εργασίες. Ενώ η εξειδίκευση μπορεί να προσφέρει αποτελεσματικότητα της διαδικασίας, είναι λιγότερο πιθανό να εμπνεύσει τους εργαζόμενους.

Με τη σειρά τους, οι ευέλικτοι ρόλοι παρέχουν όλα τα πράγματα που οδηγούν στην ικανοποίηση από την εργασία: αυτονομία, κυριαρχία και σκοπό. Η αυτονομία είναι ότι δεν εξαρτώνται από τίποτα για να πετύχουν. Η κυριαρχία έγκειται στα ισχυρά ανταγωνιστικά πλεονεκτήματα. Και η αίσθηση του σκοπού έγκειται στην ευκαιρία να έχουν αντίκτυπο στην επιχείρηση που δημιουργούν. Εάν καταφέρουμε να κάνουμε τους ανθρώπους να ενθουσιαστούν με τη δουλειά τους και να έχουμε μεγάλο αντίκτυπο στην εταιρεία, τότε όλα τα άλλα θα μπουν στη θέση τους.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο