Firwat Data Science Teams brauchen Generalisten, net Spezialisten

Firwat Data Science Teams brauchen Generalisten, net Spezialisten
HIROSHI WATANABE / GETTY IMAGES

Am The Wealth of Nations weist den Adam Smith wéi d'Divisioun vun der Aarbecht d'Haaptquell vun der erhéiter Produktivitéit gëtt. E Beispill ass d'Assemblée Linn vun enger Pin-Fabrik: "Een Aarbechter zitt den Drot, en aneren riicht et, en Drëttel schneit et, e Véierte schärft d'Enn, e Fënneften schleift den aneren Enn fir de Kapp ze passen." Dank Spezialisatioun konzentréiert op spezifesch Funktiounen, gëtt all Employé eng héichqualifizéiert Spezialist a senger schmueler Aufgab, wat zu enger verstäerkter Prozesseffizienz féiert. D'Ausgab pro Aarbechter hëlt vill Mol erop, an d'Fabréck gëtt méi effizient fir Pins ze produzéieren.

Dës Divisioun vun der Aarbecht no Funktionalitéit ass esou an eisem Kapp och haut festgestallt, datt mir eis Teams séier deementspriechend organiséiert hunn. Data Science ass keng Ausnahm. Komplex algorithmesch Geschäftsfäegkeeten erfuerderen verschidde Aarbechtsfunktiounen, sou datt Firmen typesch Teams vu Spezialisten erstellen: Fuerscher, Dateningenieuren, Maschinnléieringenieuren, Ursaach-an-Effekt Wëssenschaftler, asw. D'Aarbecht vun de Spezialisten koordinéiert vum Produktmanager mam Transfert vu Funktiounen op eng Manéier déi e Pin-Fabréck ähnelt: "eng Persoun kritt d'Donnéeën, eng aner modelléiert se, en Drëttel féiert se aus, e véierte Moossnamen" an sou weider,

Och, mir sollten eis Data Science Teams net optimiséieren fir d'Produktivitéit ze verbesseren. Wéi och ëmmer, Dir maacht dat wann Dir versteet wat Dir produzéiert: Pins oder soss eppes, a probéiert einfach d'Effizienz ze erhéijen. Den Zweck vun de Versammlungslinnen ass eng Aufgab ze kompletéieren. Mir wësse genee wat mir wëllen - Pins (wéi am Smith's Beispill), awer all Produkt oder Service kann ernimmt ginn an deem d'Ufuerderunge ganz all Aspekter vum Produkt a säi Verhalen beschreiwen. D'Roll vun de Mataarbechter ass dës Ufuerderungen esou effizient wéi méiglech ze erfëllen.

Awer d'Zil vun Data Science ass net Aufgaben ze kompletéieren. Éischter ass d'Zil fir staark nei Geschäftsméiglechkeeten z'entdecken an z'entwéckelen. Algorithmesch Produkter a Servicer wéi Empfehlungssystemer, Clientinteraktiounen, Klassifikatioun vu Stilvirléiften, Gréisst, Kleederdesign, Logistikoptimiséierung, saisonal Trenddetektioun a vill méi kënnen net am Viraus entwéckelt ginn. Si mussen studéiert ginn. Et gi keng Blueprints fir ze replizéieren, dëst sinn nei Méiglechkeeten mat inherenter Onsécherheet. Koeffizienten, Modeller, Modellarten, Hyperparameter, all néideg Elementer musse geléiert ginn duerch Experimenter, Versuch a Feeler, a Widderhuelung. Mat Pins, Training an Design ginn am Viraus vun der Produktioun gemaach. Mat Data Science léiert Dir wéi Dir maacht, net virdrun.

An enger Pinfabréck, wann d'Ausbildung fir d'éischt kënnt, erwaarden oder wëllen d'Aarbechter weder op all Feature vum Produkt improviséieren wéi d'Produktiounseffizienz ze verbesseren. Spezialiséiert Aufgaben mécht Sënn well et zu Prozesseffizienz a Produktiounskonsistenz féiert (ouni Ännerungen am Endprodukt).

Awer wann d'Produkt nach ëmmer entwéckelt an d'Zil Training ass, stéiert Spezialisatioun eis Ziler an de folgende Fäll:

1. Et erhéicht d'Koordinatiounskäschte.

Dat ass, déi Käschten, déi sech während der Zäit akkumuléiert fir ze kommunizéieren, ze diskutéieren, ze justifiéieren an ze prioritéieren déi Aarbecht déi muss gemaach ginn. Dës Käschten Skala super-linear mat der Zuel vun de Leit involvéiert. (Wéi de J. Richard Hackman eis geléiert huet, wiisst d'Zuel vun de Bezéiungen r ähnlech wéi d'Funktioun vun der Unzuel vun de Begrëffer n no dëser Equatioun: r = (n^2-n)/2. An all Bezéiung weist e puer Betrag vun der Käschten Relatioun.) Wann Datewëssenschaftler no Funktioun organiséiert sinn, an all Etapp, mat all Changement, all Iwwerreechung, asw., da gi vill Spezialisten néideg, wat d'Koordinatiounskäschte erhéicht. Zum Beispill, statistesch Modeller, déi mat neie Featuren experimentéiere wëllen, musse mat Dateningenieuren koordinéieren, déi all Kéiers wann se eppes Neies probéieren, un d'Datesets addéieren. Och all neie Modell trainéiert heescht datt de Modellentwéckler een brauch fir mat ze koordinéieren fir et a Produktioun ze setzen. Koordinatiounskäschte handelen als Präis fir Iteratioun, wat se méi schwéier an deier mécht a méi wahrscheinlech d'Etude opginn. Dëst kann d'Léieren stéieren.

2. Et mécht Waardezäite schwéier.

Nach méi beängschtegend wéi d'Koordinatiounskäschte ass d'Zäit verluer tëscht Aarbechtsverschiebungen. Wärend Koordinatiounskäschte normalerweis a Stonnen gemooss ginn - d'Zäit déi et brauch fir Reuniounen, Diskussiounen, Designbewäertungen ze maachen - d'Waardezäit gëtt normalerweis an Deeg, Wochen oder souguer Méint gemooss! Funktionell Spezialisten Zäitplang si schwéier ze balanséieren well all Spezialist muss iwwer verschidde Projete verdeelt ginn. Eng Stonn Versammlung fir Ännerungen ze diskutéieren kann Wochen daueren fir de Workflow ze gläichen. An nom Accord iwwert d'Ännerungen, ass et néideg déi eigentlech Aarbecht selwer am Kontext vun villen anere Projeten ze plangen, datt d'Aarbechtszäit vun Spezialisten besetzen. Aarbecht mat Code Fixen oder Fuerschung, déi nëmmen e puer Stonnen oder Deeg dauert fir ze kompletéieren, kënne vill méi laang daueren ier Ressourcen verfügbar sinn. Bis dohinner sinn Iteratioun a Léieren suspendéiert.

3. Et schmuel de Kontext.

D'Divisioun vun der Aarbecht kann d'Léiere kënschtlech limitéieren andeems d'Leit belount fir an hirer Spezialitéit ze bleiwen. Zum Beispill, e Fuerscher, deen am Kader vu senger Funktionalitéit muss bleiwen, fokusséiert seng Energie op Experimentéiere mat verschiddenen Typen vun Algorithmen: Regressioun, neural Netzwierker, zoufälleg Bësch, a sou weider. Natierlech kënne gutt Algorithmuswahlen zu inkrementelle Verbesserunge féieren, awer et gëtt typesch vill méi vun aneren Aktivitéiten ze gewannen, sou wéi d'Integratioun vun neien Datequellen. Och hëlleft et e Modell z'entwéckelen deen all Erklärungsmuecht ausnotzt, déi an den Daten inherent ass. Wéi och ëmmer, seng Kraaft kann an der Ännerung vun der objektiver Funktioun leien oder bestëmmte Contrainten ze relaxen. Dëst ass schwéier ze gesinn oder ze maachen wann hir Aarbecht limitéiert ass. Well en technesche Wëssenschaftler spezialiséiert ass fir Algorithmen ze optimiséieren, ass hien vill manner wahrscheinlech eppes anescht ze maachen, och wann et bedeitend Virdeeler bréngt.

Fir d'Zeechen ze nennen déi schéngen wann Datenwëssenschaftsteams als Pinfabriken handelen (zum Beispill an einfache Statusupdates): "waart op Datenpipeline Ännerungen" an "waart op ML Eng Ressourcen" sinn allgemeng Blocker. Wéi och ëmmer, ech gleewen datt de méi geféierlechen Afloss ass wat Dir net mierkt, well Dir kënnt net bedaueren wat Dir net scho wësst. Flawless Ausféierung an d'Kompatibilitéit, déi duerch d'Erreeche vun der Prozesseffizienz gewonnen gëtt, kënnen d'Wourecht maskéieren datt Organisatiounen sech net bewosst sinn iwwer d'Léiervirdeeler déi se vermëssen.

D'Léisung fir dëse Problem ass natierlech d'Fabréck Pin Method lass ze ginn. Fir d'Léieren an d'Iteratioun ze encouragéieren, sollten Datenwëssenschaftler Rollen generesch sinn awer mat breet Verantwortung onofhängeg vun der technescher Funktioun, dh Datewëssenschaftler organiséieren sou datt se optimiséiert sinn fir ze léieren. Dëst bedeit "Vollstack Spezialisten" astellen - allgemeng Spezialisten déi verschidde Funktiounen ausféieren, vu Konzept bis Modelléierung, Ëmsetzung bis Messung. Et ass wichteg ze bemierken datt ech net proposéiere datt d'Astellung vum Vollstack Talent d'Zuel vun de Mataarbechter reduzéiere soll. Éischter wäert ech einfach unhuelen datt wann se anescht organiséiert sinn, hir Ureiz besser mat de Léier- a Leeschtungsvirdeeler ausgeriicht sinn. Zum Beispill, loosst eis soen datt Dir en Team vun dräi Leit hutt mat dräi Geschäftsfäegkeeten. An enger Pin-Fabréck wäert all Techniker en Drëttel vu senger Zäit fir all Aarbechtsaufgab widmen, well keen aneren seng Aarbecht ka maachen. An engem vollen Stack ass all Generalist voll dem ganze Geschäftsprozess, Skala-up an Training gewidmet.

Mat manner Leit, déi de Produktiounszyklus ënnerstëtzen, gëtt d'Koordinatioun reduzéiert. De Generalist bewegt sech fléissend tëscht Featuren, erweidert d'Datepipeline fir méi Daten derbäi ze ginn, probéiert nei Features a Modeller ze probéieren, nei Versioune fir d'Produktioun fir kausal Miessunge ofzesetzen, a Schrëtt widderhuelen sou séier wéi nei Iddien opkommen. Natierlech mécht de Stationwagon verschidde Funktiounen sequentiell an net parallel. No allem ass et just eng Persoun. Wéi och ëmmer, eng Aufgab ofzeschléissen hëlt normalerweis nëmmen e Bruch vun der Zäit déi néideg ass fir Zougang zu enger anerer spezialiséierter Ressource ze kréien. Also, d'Iteratiounszäit reduzéiert.

Eise Generalist ass vläicht net sou qualifizéiert wéi e Spezialist an enger bestëmmter Aarbechtsfunktioun, awer mir striewen net no funktionell Perfektioun oder kleng inkrementell Verbesserungen. Mir beméien eis éischter ze léieren an ëmmer méi professionell Erausfuerderunge mat graduellen Impakt ze entdecken. Mat engem holistesche Kontext fir eng komplett Léisung, gesäit hien Chancen, déi e Spezialist géif verpassen. Hien huet méi Iddien a méi Méiglechkeeten. Hien klappt och. Wéi och ëmmer, d'Käschte vum Echec sinn niddereg an d'Virdeeler vum Léieren sinn héich. Dës Asymmetrie fördert séier Iteratioun a belount Léieren.

Et ass wichteg ze bemierken datt d'Quantitéit vun Autonomie a Fäegkeet Diversitéit, déi fir Vollstack Wëssenschaftler geliwwert gëtt, gréisstendeels ofhängeg vun der Robustheet vun der Dateplattform op där ze schaffen. Eng gutt entworf Dateplattform abstrakt Datewëssenschaftler aus de Komplexitéite vu Containeriséierung, verdeelt Veraarbechtung, automatesche Failover, an aner fortgeschratt Rechenkonzepter. Zousätzlech zu Abstraktioun kann eng robust Datenplattform nahtlos Konnektivitéit fir experimentell Infrastruktur ubidden, Iwwerwaachung an Alarm automatiséieren, automatesch Skaléieren an Visualiséierung vun algorithmesche Resultater an Debugging aktivéieren. Dës Komponente sinn entworf a gebaut vun den Dateplattformingenieuren, dat heescht datt se net vum Datewëssenschaftler un d'Dateplattformentwécklungsteam weiderginn. Et ass den Data Science Spezialist dee verantwortlech ass fir all de Code benotzt fir d'Plattform ze bedreiwen.

Ech war och eemol interesséiert an der funktionell Divisioun vun der Aarbecht mat Prozesseffizienz, awer duerch Versuch a Feeler (et gëtt kee bessere Wee fir ze léieren), hunn ech entdeckt datt typesch Rollen d'Léieren an d'Innovatioun besser erliichteren an déi richteg Metriken ubidden: Entdeckung an vill méi Geschäftsméiglechkeete bauen wéi eng spezialiséiert Approche. (Eng méi effektiv Manéier fir iwwer dës Approche fir d'Organisatioun ze léieren wéi de Versuch a Feeler, deen ech duerchgaange sinn, ass dem Amy Edmondson säi Buch Team Collaboration: How Organisations Learn, Innovate, and Compete in the Knowledge Economy ze liesen).

Et ginn e puer wichteg Viraussetzungen, datt dës Approche zu Organisatioun méi oder manner zouverlässeg an e puer Firmen maachen kann. Den Iteratiounsprozess reduzéiert d'Käschte vum Versuch a Feeler. Wann d'Käschte vum Feeler héich sinn, kënnt Dir se reduzéieren (awer dëst ass net fir medizinesch Uwendungen oder Fabrikatioun recommandéiert). Zousätzlech, wann Dir mat Petabytes oder Exabytes vun Daten ze dinn hutt, kann d'Spezialisatioun am Datetechnik erfuerderlech sinn. Och wann d'Erhalen vun Online Geschäftsfäegkeeten an hir Verfügbarkeet méi wichteg ass wéi se ze verbesseren, kann funktionell Exzellenz d'Léieren iwwerstoen. Schlussendlech hänkt de Vollstackmodell op d'Meenunge vu Leit, déi doriwwer wëssen. Si sinn net unicorns; Dir kënnt se fannen oder se selwer preparéieren. Wéi och ëmmer, si sinn héich Nofro an d'Attraktioun an d'Erhalen vun hinnen erfuerdert kompetitiv Kompensatioun, staark Firmewäerter an Erausfuerderung Aarbecht. Vergewëssert Iech datt Är Firma Kultur dëst kann ënnerstëtzen.

Och mat all deem gesot, Ech gleewen, datt de voll Stack Modell déi bescht Start Konditiounen gëtt. Start mat hinnen, an dann bewosst Richtung funktionell Divisioun vun Aarbecht nëmmen wann absolut néideg.

Et ginn aner Nodeeler vun funktionell Spezialisatioun. Dëst kann zu Verantwortungsverloscht a Passivitéit vum Deel vun den Aarbechter féieren. Smith selwer kritiséiert d'Aarbechtsdeelung, suggeréiert datt et zu Dulling vum Talent féiert, d.h. Aarbechter ginn ignorant an zréckgezunn well hir Rollen op e puer repetitive Aufgaben limitéiert sinn. Wärend Spezialisatioun Prozesseffizienz ubitt, ass et manner wahrscheinlech d'Aarbechter ze inspiréieren.

Am Tour, villsäiteg Rollen bidden all d'Saachen déi d'Zefriddenheet vun der Aarbecht féieren: Autonomie, Meeschterschaft an Zweck. Autonomie ass datt se vun näischt ofhängeg sinn fir Erfolleg ze erreechen. Maîtrise läit a staark kompetitiv Virdeeler. An de Sënn vum Zweck läit an der Geleeënheet en Impakt op d'Geschäft ze hunn, déi se kreéieren. Wa mir d'Leit iwwer hir Aarbecht begeeschteren an e groussen Impakt op d'Firma hunn, da fällt alles anescht op der Plaz.

Source: will.com

Setzt e Commentaire