Perchè e squadre di Data Science necessitanu generalisti, micca specialisti

Perchè e squadre di Data Science necessitanu generalisti, micca specialisti
HIROSHI WATANABE/GETTY IMAGES

In A Ricchezza di e Nazioni, Adam Smith mostra cumu a divisione di u travagliu diventa a fonte principale di produtividade aumentata. Un esempiu hè a catena di assemblea di una fabbrica di pin: "Un travagliadore tira u filu, un altru u dritta, un terzu u taglia, un quartu affila l'estremità, un quintu macina l'altru per adattà à a testa". Grazie à a specializazione focalizata in funzioni specifiche, ogni impiigatu diventa un specialistu altamente qualificatu in u so compitu strettu, chì porta à una crescita di l'efficienza di u prucessu. A pruduzzione per u travagliu aumenta parechje volte, è a fabbrica diventa più efficaci in a produzzione di pin.

Sta divisione di u travagliu per funziunalità hè cusì arradicata in a nostra mente ancu oghje chì avemu urganizatu rapidamente e nostre squadre in cunseguenza. Data Science ùn hè micca eccezzioni. E capacità di l'affari algoritmichi cumplessi necessitanu parechje funzioni di travagliu, cusì l'imprese creanu tipicamente squadre di specialisti: circadori, ingegneri di dati, ingegneri di apprendimentu automaticu, scientisti di causa è effettu, etc. U travagliu di i specialisti hè coordinatu da u capu di produttu cù u trasferimentu di e funzioni in una manera chì s'assumiglia à una fabbrica di pin: "una persona riceve i dati, un altru modella, un terzu l'executa, una quarta misura" è cusì.

Alas, ùn duvemu micca ottimisà i nostri squadre di Data Science per migliurà a produtividade. In ogni casu, fate questu quandu avete capitu ciò chì producete: pins o qualcosa altru, è simpricimenti strive à aumentà l'efficienza. U scopu di e linee di assemblea hè di compie un compitu. Sapemu esattamente ciò chì vulemu - pins (cum'è in l'esempiu di Smith), ma ogni pruduttu o serviziu pò esse citatu in quale i requisiti descrizanu cumplettamente tutti l'aspettu di u pruduttu è u so cumpurtamentu. U rolu di l'impiegati hè di cumpiendu questi requisiti in u più efficiente pussibule.

Ma u scopu di Data Science ùn hè micca di compie i travaglii. Piuttostu, u scopu hè di spiegà è sviluppà forti opportunità di cummerciale. I prudutti è servizii algoritmichi cum'è sistemi di ricunniscenza, interazzione cù i clienti, classificazione di preferenze di stile, dimensionamento, design di vestiti, ottimisazione logistica, rilevazione di tendenza staggione è assai più ùn ponu esse sviluppati in anticipu. Hanu da esse studiatu. Ùn ci sò micca prughjetti per riplicà, queste sò novi pussibulità cù incertezza inherente. Coefficients, mudelli, tippi di mudelli, iperparametri, tutti l'elementi necessarii devenu esse amparatu da a sperimentazione, a prova è l'errore, è a ripetizione. Cù pins, a furmazione è u disignu sò fatti prima di a produzzione. Cù Data Science, amparate cum'è fate, micca prima.

In una fabbrica di pin, quandu a furmazione vene prima, ùn avemu nè aspittà nè vulemu chì i travagliadori improvisanu nantu à qualsiasi funziunalità di u pruduttu altru ch'è per migliurà l'efficienza di a produzzione. I travaglii di specializazione sò sensu perchè porta à l'efficienza di u prucessu è a cunsistenza di a produzzione (senza cambiamenti à u pruduttu finali).

Ma quandu u pruduttu hè sempre in sviluppu è u scopu hè a furmazione, a specializazione interferiscenu cù i nostri scopi in i seguenti casi:

1. Aumenta i costi di coordinazione.

Questu hè, quelli costi chì s'acumulanu durante u tempu passatu à cumunicà, à discutiri, à ghjustificà è à priurità u travagliu chì deve esse fattu. Questi costi scalanu super-linearly cù u numeru di persone implicate. (Comu J. Richard Hackman ci hà insignatu, u numeru di rilazioni r cresce in modu simile à a funzione di u numeru di termini n sicondu sta equazioni: r = (n^2-n)/2. È ogni relazione palesa una certa quantità di relazione di costu.) Quandu i scientisti di dati sò urganizati per funzione, in ogni tappa, cù ogni cambiamentu, ogni traspurtadore, etc., assai specialisti sò richiesti, chì aumenta i costi di coordinazione. Per esempiu, i mudeli di statistiche chì volenu sperimentà cù e funzioni novi anu da coordenà cù l'ingegneri di dati chì aghjunghjenu i setti di dati ogni volta chì volenu pruvà qualcosa di novu. In listessu modu, ogni novu mudellu furmatu significa chì u sviluppatore di mudelli avarà bisognu di qualcunu per coordine per mette in produzzione. I costi di coordinazione agisce cum'è un prezzu per l'iterazione, facendu più difficiuli è caru è più prubabile di fà chì u studiu sia abbandunatu. Questu pò interferiscenu cù l'apprendimentu.

2. Face i tempi di attesa difficiule.

Ancu più intimidante di i costi di coordinazione hè u tempu persu trà i turni di travagliu. Mentre i costi di coordinazione sò generalmente misurati in ore - u tempu chì ci vole à fà riunioni, discussioni, recensioni di cuncepimentu - u tempu di attesa hè generalmente misuratu in ghjorni, settimane o ancu mesi! I schedarii di i specialisti funziunali sò difficiuli di equilibrà perchè ogni specialista deve esse distribuitu in parechji prughjetti. Una riunione d'una ora per discutiri i cambiamenti pò piglià settimane per allisà u flussu di travagliu. È dopu avè accunsentutu à i cambiamenti, hè necessariu di pianificà u travagliu propiu stessu in u cuntestu di parechji altri prughjetti chì occupanu u tempu di travagliu di specialisti. U travagliu chì implica correzioni di codice o ricerca chì dura solu uni pochi d'ore o ghjorni per compie pò piglià assai più tempu prima chì e risorse sò dispunibili. Finu à quì, l'iterazione è l'apprendimentu sò sospesi.

3. Restringe u cuntestu.

A divisione di u travagliu pò limità artificialmente l'apprendimentu ricumpinsendu e persone per stà in a so specialità. Per esempiu, un scientist di ricerca chì deve stà in u scopu di a so funziunalità cuncentrarà a so energia nantu à spirimintà cù diversi tipi d'algoritmi: regressione, rete neurale, furesta aleatoria, etc. Di sicuru, una bona scelta d'algoritmu pò purtà à migliurà incrementali, ma ci hè tipicamenti assai più per esse guadagnatu da altre attività, cum'è l'integrazione di novi fonti di dati. Inoltre, aiuterà à sviluppà un mudellu chì sfrutta ogni pocu di putenza esplicativa inherente à e dati. In ogni casu, a so forza pò esse in cambià a funzione obiettiva o rilassate certe limitazioni. Questu hè difficiule di vede o di fà quandu u so travagliu hè limitatu. Perchè un scientist tecnicu hè specializatu in l'ottimisazione di l'algoritmi, hè assai menu prubabile di fà qualcosa altru, ancu s'ellu porta benefici significati.

Per nome i segni chì appariscenu quandu e squadre di scienza di dati agisce cum'è fabbriche di pin (per esempiu, in l'aghjurnamenti di statutu simplici): "aspittendu cambiamenti di pipeline di dati" è "aspittendu risorse ML Eng" sò blockers cumuni. Tuttavia, crede chì l'influenza più periculosa hè ciò chì ùn avete micca nutatu, perchè ùn pudete micca dispiace ciò chì ùn sapete micca. L'esecuzione impeccabile è a cumpiacenza guadagnata da ottene l'efficienza di u prucessu ponu maschera a verità chì l'urganisazioni ùn sò micca cuscenti di i benefici di apprendimentu chì mancanu.

A suluzione à stu prublemu, sicuru, hè di caccià u metudu pin fabbrica. Per incuragisce l'apprendimentu è l'iterazione, i roli di scientist di dati duveranu esse generici, ma cù ampie responsabilità indipendenti da a funzione tecnica, vale à dì urganizà i scientisti di dati in modu chì sò ottimizzati per l'apprendimentu. Questu significa l'assunzione di "specialisti full stack" - specialisti generali chì ponu esse realizatu una varietà di funzioni, da u cuncettu à u mudellu, l'implementazione à a misurazione. Hè impurtante di nutà chì ùn sò micca suggerisce chì l'assunzione di talentu full-stack duverebbe riduce u numeru di l'impiegati. Piuttostu, purteraghju solu chì quandu sò organizati in modu diversu, i so incentivi sò megliu allineati cù i benefici di apprendimentu è di rendiment. Per esempiu, dicemu chì avete una squadra di trè persone cù trè cumpetenze cummerciale. In una fabbrica di pin, ogni tecnicu dedicà un terzu di u so tempu à ogni travagliu di travagliu, postu chì nimu pò fà u so travagliu. In una pila piena, ogni generalista hè cumplettamente dedicatu à tuttu u prucessu cummerciale, scale-up è furmazione.

Cù menu persone chì sustene u ciculu di produzzione, a coordinazione hè ridutta. U generalista si move in modu fluidu trà e funzioni, espansione u pipeline di dati per aghjunghje più dati, pruvate novi funziunalità in mudelli, implementendu novi versioni à a produzzione per e misurazioni causali, è ripetendu i passi più rapidamente chì e novi idee venenu. Di sicuru, u vagone di a stazione svolge diverse funzioni in sequenza è micca in parallelu. Dopu tuttu, hè solu una persona. Tuttavia, compie un compitu di solitu richiede solu una frazione di u tempu necessariu per accede à un altru risorsu specializatu. Dunque, u tempu di iterazione diminuisce.

U nostru generalista ùn pò micca esse qualificatu cum'è un specialista in una funzione particulari di u travagliu, ma ùn avemu micca streve per a perfezione funziunale o picculi miglioramenti incrementali. Piuttostu, ci sforzemu di amparà è scopre sempre più sfide prufessiunale cù un impattu graduale. Cù un cuntestu olisticu per una suluzione cumpleta, vede opportunità chì un specialista mancassi. Hà più idee è più pussibulità. Ellu falla ancu. Tuttavia, u costu di fallimentu hè bassu è i benefici di l'apprendimentu sò alti. Questa asimmetria prumove l'iterazione rapida è premia l'apprendimentu.

Hè impurtante di nutà chì a quantità di autonomia è a diversità di cumpetenze offerta à i scientisti di stack pienu dipende largamente da a robustezza di a piattaforma di dati nantu à quale travaglià. Una piattaforma di dati ben cuncepita astrae i scientisti di dati da e cumplessità di containerizazione, trasfurmazioni distribuite, failover automaticu è altri cuncetti avanzati di l'informatica. In più di l'astrazione, una robusta piattaforma di dati pò furnisce una connettività senza saldatura à l'infrastruttura sperimentale, automatizà u monitoraghju è l'alerta, permette a scala automatica è a visualizazione di risultati algoritmichi è debugging. Questi cumpunenti sò cuncepiti è custruiti da l'ingegneri di a piattaforma di dati, vale à dì chì ùn sò micca trasmessi da u scientist di dati à a squadra di sviluppu di a piattaforma di dati. Hè u specialista di Data Science chì hè rispunsevule per tuttu u codice utilizatu per eseguisce a piattaforma.

Anch'eo era una volta interessatu à a divisione funziunale di u travagliu cù l'efficienza di u prucessu, ma per mezu di prova è errore (ùn ci hè micca un modu megliu per amparà), aghju scupertu chì i roli tipici facilitanu megliu l'apprendimentu è l'innuvazione è furnisce i metrici ghjusti: scopre è custruendu assai più opportunità di cummerciale chè un approcciu specializatu. (Un modu più efficau per amparà nantu à questu approcciu à l'urganizazione cà u prucessu è l'errore chì aghju passatu hè di leghje u libru di Amy Edmondson Team Collaboration: How Organizations Learn, Innovate, and Compete in the Knowledge Economy).

Ci hè parechje ipotesi impurtanti chì ponu fà stu approcciu à l'urganizazione più o menu affidabile in certi cumpagnie. U prucessu di iterazione reduce u costu di prucessu è errore. Se u costu di l'errore hè altu, pudete vulete riduce (ma questu ùn hè micca cunsigliatu per l'applicazioni medichi o a fabricazione). Inoltre, se si tratta di petabyte o exabyte di dati, a specializazione in l'ingegneria di dati pò esse dumandata. In listessu modu, se mantene e capacità di l'imprese in linea è a so dispunibilità hè più impurtante chè a migliurà, l'eccellenza funzionale pò vince l'apprendimentu. Infine, u mudellu di stack cumpletu si basa nantu à l'opinioni di e persone chì cunnosci. Ùn sò micca unicorni; li pudete truvà o preparalli sè stessu. Tuttavia, sò in alta dumanda è attrae è mantene elli necessitanu una compensazione competitiva, forti valori corporativi è un travagliu sfida. Assicuratevi chì a cultura di a vostra cumpagnia pò sustene questu.

Ancu cun tuttu ciò chì hà dettu, crede chì u mudellu di pila piena furnisce e migliori cundizioni di partenza. Cumincià cun elli, è poi cunsciendu versu una divisione funziunale di u travagliu solu quandu hè assolutamente necessariu.

Ci sò altri disadvantages di specializazione funziunale. Questu pò purtà à a perdita di rispunsabilità è di passività da parte di i travagliadori. Smith stessu critica a divisione di u travagliu, suggerenu chì porta à l'annullamentu di u talentu, i.e. i travagliadori diventanu ignoranti è ritirati postu chì i so roli sò limitati à uni pochi di travaglii ripetitivi. Mentre a specializazione pò furnisce l'efficienza di u prucessu, hè menu prubabile di inspirà i travagliadori.

À u turnu, i roli versatili furniscenu tutte e cose chì guidanu a satisfaczione di u travagliu: l'autonomia, a maestria è u scopu. L'autonomia hè chì ùn dependenu micca di nunda per ottene u successu. A maestria si trova in forti vantaghji competitivi. È u sensu di scopu si trova in l'uppurtunità di avè un impattu nantu à l'affari chì creanu. Se pudemu avè a ghjente entusiasmata cù u so travagliu è avè un grande impattu nantu à a cumpagnia, allora tuttu u restu caderà in u locu.

Source: www.habr.com

Add a comment