Af hverju Data Science teymi þurfa almenna menn, ekki sérfræðinga

Af hverju Data Science teymi þurfa almenna menn, ekki sérfræðinga
HIROSHI WATANABE/GETTY MYNDIR

Í The Wealth of Nations sýnir Adam Smith hvernig verkaskiptingin verður helsta uppspretta aukinnar framleiðni. Dæmi er færiband pinnaverksmiðju: „Einn starfsmaður dregur í vírinn, annar réttir hann, þriðji klippir hann, fjórði brýnir endann, fimmti malar hinn endann til að passa höfuðið. Þökk sé sérhæfingu með áherslu á sérstakar aðgerðir verður hver starfsmaður mjög hæfur sérfræðingur í sínu þrönga verkefni, sem leiðir til aukinnar skilvirkni í ferlinu. Framleiðsla á hvern starfsmann eykst margfalt og verksmiðjan verður skilvirkari í framleiðslu pinna.

Þessi verkaskipting eftir virkni er svo rótgróin í huga okkar enn þann dag í dag að við skipulögðum teymi okkar fljótt í samræmi við það. Data Science er engin undantekning. Flókin reiknirit viðskiptageta krefst margra vinnuaðgerða, þannig að fyrirtæki búa venjulega til teymi sérfræðinga: vísindamenn, gagnaverkfræðinga, vélanámsverkfræðinga, orsök-og-afleiðingarfræðinga, og svo framvegis. Vinnu sérfræðinganna er samræmd af vörustjóra með flutningi á aðgerðum á þann hátt sem líkist pinnaverksmiðju: "einn aðili tekur við gögnunum, annar mótar þau, þriðji framkvæmir þau, fjórði mælir" og svo framvegis,

Því miður, við ættum ekki að fínstilla Data Science teymi okkar til að bæta framleiðni. Hins vegar gerirðu þetta þegar þú skilur hvað þú ert að framleiða: pinna eða eitthvað annað, og einfaldlega leitast við að auka skilvirkni. Tilgangur færibanda er að klára verkefni. Við vitum nákvæmlega hvað við viljum - nælur (eins og í dæmi Smith), en hægt er að nefna hvaða vöru eða þjónustu sem er þar sem kröfurnar lýsa að fullu öllum hliðum vörunnar og hegðun hennar. Hlutverk starfsmanna er að uppfylla þessar kröfur eins vel og hægt er.

En markmið Data Science er ekki að klára verkefni. Markmiðið er frekar að kanna og þróa sterk ný viðskiptatækifæri. Ekki er hægt að þróa reikniritvörur og þjónusta eins og meðmælakerfi, samskipti viðskiptavina, flokkun á stílstillingum, stærðum, fatahönnun, hagræðingu flutninga, uppgötvun árstíðabundinna þróunar og margt fleira. Þeir verða að rannsaka. Það eru engar teikningar til að endurtaka, þetta eru nýir möguleikar með eðlislægri óvissu. Stuðlar, líkön, gerð líkana, ofbreytur, allir nauðsynlegir þættir verða að læra með tilraunum, tilraunum og mistökum og endurtekningu. Með nælum er þjálfun og hönnun unnin fyrir framleiðslu. Með Data Science lærir þú eins og þú gerir, ekki áður.

Í pinnaverksmiðju, þegar þjálfun er í fyrirrúmi, hvorki væntum við né viljum að starfsmenn spinni á neinum eiginleikum vörunnar nema að bæta framleiðsluhagkvæmni. Sérhæfð verkefni eru skynsamleg vegna þess að það leiðir til skilvirkni í ferli og samræmi í framleiðslu (án breytinga á lokaafurð).

En þegar varan er enn að þróast og markmiðið er þjálfun truflar sérhæfing markmið okkar í eftirfarandi tilvikum:

1. Það eykur samhæfingarkostnað.

Það er sá kostnaður sem safnast upp á þeim tíma sem fer í að miðla, ræða, rökstyðja og forgangsraða þeirri vinnu sem þarf að vinna. Þessi kostnaður skalast mjög línulega með fjölda þeirra sem taka þátt. (Eins og J. Richard Hackman kenndi okkur þá vex fjöldi tengsla r á svipaðan hátt og fall fjölda liða n samkvæmt þessari jöfnu: r = (n^2-n)/2. Og hvert samband sýnir eitthvað magn af kostnaðarsamband.) Þegar gagnafræðingar eru skipulagðir eftir störfum, á hverju stigi, með hverri breytingu, hverri afhendingu o.s.frv., þarf marga sérfræðinga, sem eykur samhæfingarkostnað. Til dæmis, tölfræðilíkön sem vilja gera tilraunir með nýja eiginleika verða að samræma sig við gagnaverkfræðinga sem bæta við gagnasöfnin í hvert sinn sem þeir vilja prófa eitthvað nýtt. Sömuleiðis þýðir hver ný gerð sem er þjálfuð að líkanframleiðandinn mun þurfa einhvern til að samræma við til að setja hana í framleiðslu. Samhæfingarkostnaður virkar sem verð fyrir endurtekningu, sem gerir hann erfiðari og dýrari og líklegri til að valda því að rannsóknin verði hætt. Þetta getur truflað nám.

2. Það gerir biðtíma erfiða.

Jafnvel meira skelfilegt en samhæfingarkostnaður er tíminn sem tapast á milli vakta. Þó samhæfingarkostnaður sé venjulega mældur í klukkustundum - tíminn sem það tekur að halda fundi, umræður, hönnunarrýni - er biðtími venjulega mældur í dögum, vikum eða jafnvel mánuðum! Erfitt er að jafna áætlanir starfrænna sérfræðinga vegna þess að hver sérfræðingur verður að dreifast yfir mörg verkefni. Klukkutíma fundur til að ræða breytingar getur tekið vikur að jafna vinnuflæðið. Og eftir að hafa verið sammála um breytingarnar þarf að skipuleggja sjálfa vinnuna í samhengi við mörg önnur verkefni sem taka vinnutíma sérfræðinga. Vinna sem felur í sér kóðaleiðréttingar eða rannsóknir sem tekur aðeins nokkrar klukkustundir eða daga að ljúka getur tekið mun lengri tíma áður en úrræði verða tiltæk. Þangað til er ítrekun og nám stöðvuð.

3. Það þrengir samhengið.

Verkaskiptingin getur takmarkað nám tilbúnar með því að umbuna fólki fyrir að vera áfram í sérgrein sinni. Til dæmis mun vísindamaður sem verður að halda sig innan umfangs virkni sinnar einbeita orku sinni að því að gera tilraunir með mismunandi gerðir reiknirita: aðhvarf, tauganet, tilviljunarkenndan skóg og svo framvegis. Auðvitað getur gott val á reiknirit leitt til stigvaxandi umbóta, en það er venjulega miklu meira að vinna úr annarri starfsemi, svo sem samþættingu nýrra gagnagjafa. Sömuleiðis mun það hjálpa til við að þróa líkan sem nýtir sérhvern hluta af skýringarkrafti sem felst í gögnunum. Hins vegar getur styrkur þess falist í því að breyta hlutlægri virkni eða slaka á ákveðnum þvingunum. Þetta er erfitt að sjá eða gera þegar vinna hennar er takmörkuð. Vegna þess að tæknifræðingur sérhæfir sig í að fínstilla reiknirit eru mun ólíklegri til að gera eitthvað annað, jafnvel þótt það hafi verulegan ávinning í för með sér.

Til að nefna merki sem birtast þegar gagnavísindateymi starfa sem pinnaverksmiðjur (til dæmis í einföldum stöðuuppfærslum): „beðið eftir breytingum á gagnaleiðslum“ og „beðið eftir ML Eng auðlindum“ eru algengir blokkarar. Hins vegar tel ég að hættulegri áhrifin séu það sem þú tekur ekki eftir því þú getur ekki séð eftir því sem þú veist ekki nú þegar. Gallalaus framkvæmd og sjálfsánægjan sem fæst við að ná fram skilvirkni ferlisins geta dulið sannleikann um að stofnanir séu ekki meðvitaðar um námsávinninginn sem þau eru að missa af.

Lausnin á þessu vandamáli er auðvitað að losna við verksmiðjupinnaaðferðina. Til að hvetja til náms og endurtekningar ættu hlutverk gagnafræðinga að vera almenn en hafa víðtæka ábyrgð óháð tæknilegu hlutverki, þ.e. skipuleggja gagnafræðinga þannig að þeir séu sem bestir fyrir nám. Þetta þýðir að ráða „fullan stafla sérfræðinga“ - almenna sérfræðinga sem geta sinnt margvíslegum aðgerðum, frá hugmynd til líkanagerðar, útfærslu til mælinga. Það er mikilvægt að hafa í huga að ég er ekki að leggja til að ráðning á fullum stafla ætti að fækka starfsmönnum. Heldur mun ég einfaldlega gera ráð fyrir því að þegar þau eru skipulögð öðruvísi, þá er hvatning þeirra betur í takt við náms- og frammistöðuávinninginn. Segjum til dæmis að þú sért með þriggja manna teymi með þrjá viðskiptahæfileika. Í pinnaverksmiðju mun hver tæknimaður verja þriðjungi af tíma sínum í hvert verk þar sem enginn annar getur sinnt starfi sínu. Í fullum stafla er hver almennur að fullu helgaður öllu viðskiptaferlinu, uppbyggingu og þjálfun.

Með færri sem styðja framleiðsluferlið minnkar samhæfingin. Almenntunarfræðingurinn fer fljótt á milli eiginleika, stækkar gagnaleiðslan til að bæta við fleiri gögnum, prófar nýja eiginleika í líkönum, setur nýjar útgáfur í framleiðslu til orsakamælinga og endurtekur skref eins fljótt og nýjar hugmyndir koma upp. Að sjálfsögðu sinnir stationvagninn mismunandi hlutverkum í röð og ekki samhliða. Enda er þetta bara ein manneskja. Hins vegar tekur að klára verkefni venjulega aðeins brot af þeim tíma sem þarf til að fá aðgang að öðru sérhæfðu úrræði. Svo endurtekningartíminn minnkar.

Almennir okkar eru kannski ekki eins færir og sérfræðingur í tilteknu starfi, en við kappkostum ekki að fullkomnun í starfi eða smávægilegum endurbótum. Frekar kappkostum við að læra og uppgötva fleiri og fleiri faglegar áskoranir með smám saman áhrifum. Með heildrænu samhengi fyrir heildarlausn sér hann tækifæri sem sérfræðingur myndi missa af. Hann hefur fleiri hugmyndir og fleiri möguleika. Hann mistekst líka. Hins vegar er kostnaðurinn við mistök lítill og ávinningurinn af námi mikill. Þessi ósamhverfa stuðlar að hraðri endurtekningu og verðlaunar nám.

Það er mikilvægt að hafa í huga að hversu mikið sjálfræði og hæfileikafjölbreytni sem vísindamönnum er í boði er að miklu leyti háð styrkleika gagnavettvangsins sem þeir vinna á. Vel hannaður gagnavettvangur dregur gagnafræðinga út úr margbreytileika gámavæðingar, dreifðrar vinnslu, sjálfvirkrar bilunar og annarra háþróaðra tölvuhugmynda. Til viðbótar við útdrætti, getur öflugur gagnavettvangur veitt óaðfinnanlega tengingu við tilraunainnviði, sjálfvirkt eftirlit og viðvörun, gert sjálfvirka mælingu og sjónræna niðurstöður reiknirit og villuleit. Þessir íhlutir eru hannaðir og smíðaðir af verkfræðingum gagnavettvangsins, sem þýðir að þeir eru ekki fluttir frá gagnafræðingnum til þróunarteymis gagnapallsins. Það er gagnavísindasérfræðingurinn sem ber ábyrgð á öllum kóðanum sem notaður er til að keyra pallinn.

Ég hafði líka einu sinni áhuga á hagnýtri verkaskiptingu með því að nota ferli skilvirkni, en með því að prófa og villa (það er engin betri leið til að læra), komst ég að því að dæmigerð hlutverk auðvelda betur nám og nýsköpun og veita réttu mælikvarða: uppgötva og byggja upp mun fleiri viðskiptatækifæri en sérhæfða nálgun. (Áhrifaríkari leið til að læra um þessa nálgun við skipulagningu en tilraunina og villuna sem ég fór í gegnum er að lesa bók Amy Edmondson Team Collaboration: How Organizations Learn, Innovate, and Compete in the Knowledge Economy).

Það eru nokkrar mikilvægar forsendur sem geta gert þessa aðferð við skipulagningu meira eða minna áreiðanlega í sumum fyrirtækjum. Endurtekningarferlið dregur úr kostnaði við að prófa og villa. Ef villukostnaðurinn er hár gætirðu viljað draga úr þeim (en þetta er ekki mælt með því fyrir læknisfræðilega notkun eða framleiðslu). Að auki, ef þú ert að fást við petabytes eða exabytes af gögnum, gæti verið krafist sérhæfingar í gagnaverkfræði. Sömuleiðis, ef viðhalda getu netviðskipta og aðgengi þeirra er mikilvægara en að bæta þá, gæti hagnýtur ágæti troðið nám. Að lokum byggir heildarstafla líkanið á skoðunum fólks sem veit um það. Þeir eru ekki einhyrningar; þú getur fundið þær eða útbúið þær sjálfur. Hins vegar er mikil eftirspurn eftir þeim og að laða að og halda þeim mun krefjast samkeppnislegra launa, sterkra fyrirtækjagilda og krefjandi vinnu. Gakktu úr skugga um að fyrirtækjamenning þín geti stutt þetta.

Jafnvel þrátt fyrir allt sem sagt er, þá tel ég að líkanið í fullri stafla veiti bestu byrjunarskilyrðin. Byrjaðu á þeim og farðu síðan meðvitað í átt að virkri verkaskiptingu aðeins þegar brýna nauðsyn krefur.

Það eru aðrir ókostir við starfræna sérhæfingu. Þetta getur leitt til ábyrgðarmissis og aðgerðaleysis starfsmanna. Smith gagnrýnir sjálfur verkaskiptingu og bendir á að hún leiði til sljóleika á hæfileikum, þ.e. starfsmenn verða fáfróðir og afturkallaðir þar sem hlutverk þeirra takmarkast við nokkur endurtekin verkefni. Þó að sérhæfing geti veitt skilvirkni í ferlinu, er ólíklegra að hún veiti starfsmönnum innblástur.

Aftur á móti veita fjölhæf hlutverk allt það sem ýtir undir starfsánægju: sjálfræði, leikni og tilgang. Sjálfræði er að þeir eru ekki háðir neinu til að ná árangri. Leikni felst í sterkum samkeppnisforskotum. Og tilgangurinn felst í tækifærinu til að hafa áhrif á fyrirtækið sem þeir búa til. Ef við náum að vekja fólk til að spenna sig fyrir starfi sínu og hafa mikil áhrif á fyrirtækið, þá mun allt annað falla niður.

Heimild: www.habr.com

Bæta við athugasemd