Proč týmy Data Science potřebují generalisty, ne specialisty

Proč týmy Data Science potřebují generalisty, ne specialisty
HIROSHI WATANABE/GETTY IMAGES

Adam Smith v The Wealth of Nations ukazuje, jak se dělba práce stává hlavním zdrojem zvýšené produktivity. Příkladem je montážní linka továrny na výrobu kolíků: „Jeden dělník drát tahá, další rovná, třetí stříhá, čtvrtý brousí konec, pátý brousí druhý konec, aby se vešel do hlavy.“ Díky specializaci zaměřené na konkrétní funkce se každý zaměstnanec stává vysoce kvalifikovaným specialistou ve svém úzkém úkolu, což vede ke zvýšení efektivity procesů. Výkon na pracovníka se mnohonásobně zvyšuje a továrna se stává efektivnější ve výrobě kolíků.

Tato dělba práce podle funkčnosti je tak zakořeněná v našich myslích i dnes, že jsme podle toho rychle zorganizovali naše týmy. Data Science není výjimkou. Složité algoritmické obchodní funkce vyžadují více pracovních funkcí, takže společnosti obvykle vytvářejí týmy specialistů: výzkumníky, datové inženýry, inženýry strojového učení, vědce příčin a následků atd. Práci specialistů koordinuje produktový manažer s přenosem funkcí způsobem, který připomíná továrnu na piny: „jedna osoba přijímá data, druhá je modeluje, třetí provádí, čtvrtá měří“ a tak dále,

Bohužel bychom neměli optimalizovat naše týmy Data Science za účelem zvýšení produktivity. Děláte to však, když rozumíte tomu, co vyrábíte: špendlíky nebo něco jiného, ​​a jednoduše se snažíte zvýšit efektivitu. Účelem montážních linek je dokončit úkol. Víme přesně, co chceme – špendlíky (jako ve Smithově příkladu), ale lze zmínit jakýkoli produkt nebo službu, u kterých požadavky plně popisují všechny aspekty produktu a jeho chování. Úkolem zaměstnanců je tyto požadavky co nejefektivněji plnit.

Cílem Data Science ale není dokončit úkoly. Cílem je spíše prozkoumat a rozvíjet nové silné obchodní příležitosti. Algoritmické produkty a služby, jako jsou systémy doporučení, interakce se zákazníky, klasifikace stylových preferencí, dimenzování, návrh oblečení, optimalizace logistiky, detekce sezónních trendů a mnoho dalšího, nelze vyvíjet předem. Musí být studovány. Neexistují žádné plány k replikaci, to jsou nové možnosti s inherentní nejistotou. Koeficienty, modely, typy modelů, hyperparametry, všechny potřebné prvky se musí naučit experimentováním, pokusy a omyly a opakováním. U kolíků se školení a design provádí před výrobou. S Data Science se učíte tak, jak se učíte, ne dříve.

V továrně na výrobu kolíků, když je školení na prvním místě, neočekáváme ani nechceme, aby pracovníci improvizovali na jakékoli vlastnosti produktu kromě zlepšení efektivity výroby. Specializace úkolů má smysl, protože vede k efektivitě procesu a konzistenci výroby (beze změn konečného produktu).

Ale když se produkt stále vyvíjí a cílem je školení, specializace zasahuje do našich cílů v následujících případech:

1. Zvyšuje náklady na koordinaci.

Tedy ty náklady, které se kumulují během času stráveného komunikací, diskusí, zdůvodňováním a upřednostňováním práce, kterou je třeba udělat. Tyto náklady se škálují superlineárně s počtem zúčastněných osob. (Jak nás učil J. Richard Hackman, počet vztahů r roste podobně jako funkce počtu členů n podle této rovnice: r = (n^2-n)/2. A každý vztah odhaluje určité množství nákladový vztah.) Když jsou datoví vědci organizováni podle funkcí, v každé fázi, při každé změně, každém předání atd., je zapotřebí mnoho specialistů, což zvyšuje náklady na koordinaci. Například statistickí modeláři, kteří chtějí experimentovat s novými funkcemi, se budou muset koordinovat s datovými inženýry, kteří přidávají do datových sad pokaždé, když chtějí vyzkoušet něco nového. Stejně tak každý nový vyškolený model znamená, že vývojář modelu bude potřebovat někoho, s kým bude koordinovat jeho uvedení do výroby. Náklady na koordinaci fungují jako cena za iteraci, což je činí obtížnějšími a nákladnějšími a pravděpodobněji způsobí opuštění studie. To může narušovat učení.

2. Ztěžuje čekací doby.

Ještě více skličující než koordinační náklady jsou časové ztráty mezi pracovními směnami. Zatímco náklady na koordinaci se obvykle měří v hodinách – čas potřebný k vedení schůzek, diskuzí, přezkoumání návrhu – čekací doba se obvykle měří ve dnech, týdnech nebo dokonce měsících! Harmonogramy funkčních specialistů je obtížné vyvážit, protože každý specialista musí být rozdělen do více projektů. Hodinová schůzka k prodiskutování změn může trvat týdny, než se pracovní postup vyhladí. A po odsouhlasení změn je nutné plánovat samotnou práci v kontextu mnoha dalších projektů, které zabírají pracovní dobu specialistů. Práce zahrnující opravy kódu nebo výzkum, jejichž dokončení trvá jen několik hodin nebo dní, může trvat mnohem déle, než budou zdroje dostupné. Do té doby je iterace a učení pozastaveno.

3. Zužuje kontext.

Dělba práce může uměle omezovat učení tím, že odměňuje lidi za to, že zůstávají ve své specializaci. Například vědecký pracovník, který musí zůstat v rozsahu svých funkcí, zaměří svou energii na experimentování s různými typy algoritmů: regrese, neuronové sítě, náhodný les a tak dále. Dobrá volba algoritmu může samozřejmě vést k postupným zlepšením, ale obvykle lze získat mnohem více z jiných činností, jako je integrace nových zdrojů dat. Stejně tak pomůže vyvinout model, který využije každý kousek vysvětlovací schopnosti obsažené v datech. Jeho síla však může spočívat ve změně objektivní funkce nebo uvolnění určitých omezení. To je těžké vidět nebo dělat, když je její práce omezená. Protože se technický vědec specializuje na optimalizaci algoritmů, je mnohem méně pravděpodobné, že udělá něco jiného, ​​i když to přináší významné výhody.

Abychom pojmenovali příznaky, které se objevují, když týmy datových věd jednají jako továrny na piny (například při jednoduchých aktualizacích stavu): „čekání na změny datového kanálu“ a „čekání na zdroje ML Eng“ jsou běžné blokátory. Nicméně věřím, že nebezpečnější vliv je to, čeho si nevšimnete, protože nemůžete litovat toho, co ještě nevíte. Bezchybné provádění a samolibost získaná z dosahování efektivity procesů mohou maskovat skutečnost, že organizace si nejsou vědomy výhod učení, o které přicházejí.

Řešením tohoto problému je samozřejmě zbavit se metody továrního pinu. Aby se podpořilo učení a opakování, role datových vědců by měly být obecné, ale s širokou odpovědností nezávislou na technické funkci, tj. organizovat datové vědce tak, aby byli optimalizováni pro učení. To znamená najmout „full stack specialisty“ – obecné specialisty, kteří mohou provádět různé funkce, od konceptu přes modelování, implementaci až po měření. Je důležité poznamenat, že nenaznačuji, že by najímání full-stack talentů mělo snížit počet zaměstnanců. Spíše budu jednoduše předpokládat, že když jsou organizováni jinak, jejich pobídky jsou lépe sladěny s přínosy učení a výkonu. Řekněme například, že máte tým tří lidí se třemi obchodními dovednostmi. V továrně na čepy bude každý technik věnovat třetinu svého času každému pracovnímu úkolu, protože jeho práci nemůže dělat nikdo jiný. V plném rozsahu se každý generalista plně věnuje celému obchodnímu procesu, škálování a školení.

S menším počtem lidí, kteří podporují výrobní cyklus, se snižuje koordinace. Všeobecný uživatel plynule přechází mezi funkcemi, rozšiřuje datový kanál a přidává další data, zkouší nové funkce v modelech, nasazuje nové verze do výroby pro kauzální měření a opakuje kroky tak rychle, jak přicházejí nové nápady. Kombi samozřejmě plní různé funkce postupně a ne paralelně. Vždyť je to jen jeden člověk. Dokončení úkolu však obvykle zabere jen zlomek času potřebného pro přístup k jinému specializovanému zdroji. Doba iterace se tedy zkracuje.

Náš generalista nemusí být tak zručný jako specialista na určitou pracovní funkci, ale nesnažíme se o funkční dokonalost nebo malá postupná vylepšení. Spíše se snažíme učit a objevovat další a další profesní výzvy s postupným dopadem. S holistickým kontextem pro kompletní řešení vidí příležitosti, které by specialista propásl. Má více nápadů a více možností. Také se mu nedaří. Cena neúspěchu je však nízká a přínos učení vysoký. Tato asymetrie podporuje rychlé opakování a odměňuje učení.

Je důležité poznamenat, že míra autonomie a rozmanitosti dovedností poskytovaná vědcům s plným zásobníkem do značné míry závisí na robustnosti datové platformy, na které se pracuje. Dobře navržená datová platforma abstrahuje datové vědce od složitosti kontejnerizace, distribuovaného zpracování, automatického převzetí služeb při selhání a dalších pokročilých počítačových konceptů. Kromě abstrakce může robustní datová platforma poskytovat bezproblémové připojení k experimentální infrastruktuře, automatizovat monitorování a upozorňování, umožnit automatické škálování a vizualizaci výsledků algoritmů a ladění. Tyto komponenty jsou navrženy a sestaveny inženýry datové platformy, což znamená, že nejsou předávány datovým vědcům vývojovému týmu datové platformy. Je to specialista na Data Science, který je zodpovědný za veškerý kód používaný k provozu platformy.

I já jsem se kdysi zajímal o funkční dělbu práce pomocí efektivity procesů, ale metodou pokusů a omylů (není lepšího způsobu učení) jsem zjistil, že typické role lépe usnadňují učení a inovace a poskytují správné metriky: objevování a budování mnohem více obchodních příležitostí než specializovaný přístup. (Efektivnější způsob, jak se dozvědět o tomto přístupu k organizování než pokusy a omyly, kterými jsem prošel, je přečíst si knihu Amy Edmondson Team Collaboration: How Organizations Learn, Innovate, and Compete in the Knowledge Economy).

Existují některé důležité předpoklady, díky kterým může být tento přístup k organizaci v některých společnostech více či méně spolehlivý. Iterační proces snižuje náklady na pokusy a omyly. Pokud jsou náklady na chyby vysoké, možná je budete chtít snížit (to se však nedoporučuje pro lékařské aplikace nebo výrobu). Navíc, pokud pracujete s petabajty nebo exabajty dat, může být vyžadována specializace na datové inženýrství. Podobně, pokud je udržování schopností online podnikání a jejich dostupnosti důležitější než jejich zlepšování, funkční dokonalost může trumfnout učení. A konečně, model plného zásobníku spoléhá na názory lidí, kteří o něm vědí. Nejsou to jednorožci; můžete je najít nebo si je sami připravit. Jsou však velmi žádané a jejich přilákání a udržení bude vyžadovat konkurenceschopnou odměnu, silné firemní hodnoty a náročnou práci. Ujistěte se, že vaše firemní kultura to může podporovat.

I přes to, co bylo řečeno, věřím, že model s plným stackem poskytuje nejlepší výchozí podmínky. Začněte s nimi a pak vědomě směřujte k funkční dělbě práce pouze tehdy, je-li to nezbytně nutné.

Funkční specializace má i další nevýhody. To může vést ke ztrátě odpovědnosti a pasivitě ze strany pracovníků. Sám Smith dělbu práce kritizuje a naznačuje, že vede k otupování talentu, tzn. pracovníci se stávají nevědomými a odtažitými, protože jejich role jsou omezeny na několik opakujících se úkolů. I když specializace může zajistit efektivitu procesu, je méně pravděpodobné, že bude inspirovat pracovníky.

Všestranné role zase poskytují všechny věci, které řídí spokojenost s prací: autonomii, mistrovství a účel. Autonomie spočívá v tom, že k dosažení úspěchu nezávisí na ničem. Mistrovství spočívá v silných konkurenčních výhodách. A smysl pro účel spočívá v příležitosti mít vliv na podnikání, které vytvářejí. Pokud dokážeme lidi nadchnout pro jejich práci a mít velký dopad na společnost, pak vše ostatní zapadne.

Zdroj: www.habr.com

Přidat komentář