Naha tim Élmu Data peryogi generalis, sanés spesialis

Naha tim Élmu Data peryogi generalis, sanés spesialis
HIROSHI WATANABE / Gambar Getty

Dina The Wealth of Nations, Adam Smith nunjukkeun kumaha pembagian tanaga kerja janten sumber utama kanaékan produktivitas. Hiji conto nyaéta jalur perakitan pabrik pin: "Saurang pagawé narik kawat, anu sanés ngalempengkeunana, anu katilu motongna, anu kaopat ngasah tungtung, anu kalima ngagiling tungtung anu sanés pikeun pas kana sirah." Hatur nuhun kana Spésialisasi fokus kana fungsi husus, unggal pagawe jadi spesialis kacida mumpuni dina tugas sempit na, nu ngakibatkeun ngaronjat efisiensi prosés. Kaluaran per pagawe naek sababaraha kali leuwih, jeung pabrik jadi leuwih efisien dina ngahasilkeun pin.

Divisi tanaga gawé ieu dumasar kana fungsionalitas geus jadi ingrained dina pikiran urang malah kiwari yén urang gancang ngatur tim kami sasuai. Élmu Data aya iwal. Kamampuhan bisnis algoritmik kompléks merlukeun sababaraha fungsi gawé, ku kituna pausahaan ilaharna nyieun tim spesialis: peneliti, insinyur data, insinyur mesin learning, élmuwan sabab-akibat, jeung saterusna. Karya spesialis dikoordinir ku manajer produk kalayan mindahkeun fungsi dina cara anu nyarupaan pabrik pin: "hiji jalma nampi data, model anu sanés, katilu ngalaksanakeunana, ukuran kaopat" sareng saterasna,

Hanjakalna, urang henteu kedah ngaoptimalkeun tim Élmu Data urang pikeun ningkatkeun produktivitas. Nanging, ieu anu anjeun laksanakeun nalika anjeun ngartos naon anu anjeun hasilkeun: pin atanapi anu sanés, sareng ngan saukur narékahan pikeun ningkatkeun efisiensi. Tujuan tina garis assembly nyaéta pikeun ngalengkepan tugas. Urang terang persis naon anu urang hoyongkeun - pin (sapertos dina conto Smith), tapi naon waé produk atanapi jasa tiasa disebatkeun dimana saratna ngajelaskeun sadayana aspék produk sareng paripolahna. Peran karyawan nyaéta pikeun nyumponan sarat ieu sacara épisién mungkin.

Tapi tujuan Élmu Data sanés pikeun ngarengsekeun tugas. Sabalikna, tujuanana nyaéta pikeun ngajalajah sareng ngembangkeun kasempetan bisnis anyar anu kuat. Produk sareng jasa algoritmik sapertos sistem rekomendasi, interaksi palanggan, klasifikasi preferensi gaya, ukuran, desain pakean, optimasi logistik, deteksi trend musiman sareng seueur deui anu teu tiasa dikembangkeun sateuacanna. Éta kudu diajar. Henteu aya blueprints pikeun ngayakeun réplikasi, ieu mangrupikeun kamungkinan anyar kalayan kateupastian anu alami. Koefisien, model, tipe model, hyperparameters, sakabeh elemen diperlukeun kudu diajar ngaliwatan experimentation, trial and error, sarta pengulangan. Kalayan pin, latihan sareng desain dilakukeun sateuacanna produksi. Kalayan Élmu Data, anjeun diajar sapertos anu anjeun lakukeun, sanés sateuacanna.

Di pabrik pin, nalika latihan mimitina, urang henteu ngarep-ngarep atanapi hoyong para pagawé improvisasi kana fitur naon waé produk sanés pikeun ningkatkeun efisiensi produksi. Ngahususkeun tugas ngajadikeun rasa sabab ngakibatkeun efisiensi prosés jeung konsistensi produksi (tanpa parobahan dina produk ahir).

Tapi nalika produk masih ngembang sareng tujuanana nyaéta latihan, spésialisasi ngaganggu tujuan urang dina kasus ieu:

1. Ieu ngaronjatkeun waragad koordinasi.

Hartina, éta waragad anu akumulasi salila waktu komunikasi, ngabahas, menerkeun jeung prioritizing karya anu kudu dipigawé. Biaya ieu skala super-linier kalayan jumlah jalma anu kalibet. (Salaku J. Richard Hackman ngajarkeun urang, jumlah hubungan r tumuwuh sarupa jeung fungsi jumlah istilah n nurutkeun persamaan ieu: r = (n ^ 2-n) / 2. Sarta unggal hubungan nembongkeun sababaraha jumlah tina hubungan biaya.) Nalika élmuwan data dikelompokeun ku fungsi, dina unggal tahapan, kalayan unggal parobihan, unggal panyerahan, jsb, seueur spesialis anu diperyogikeun, anu ningkatkeun biaya koordinasi. Salaku conto, modeler statistik anu hoyong ékspérimén sareng fitur énggal kedah koordinasi sareng insinyur data anu nambihan set data unggal waktos aranjeunna hoyong nyobian hal anu énggal. Kitu ogé, unggal model anyar dilatih hartina pamekar modél bakal butuh batur pikeun koordinat kalawan nempatkeun kana produksi. Biaya koordinasi tindakan minangka harga pikeun iterasi, ngajantenkeun aranjeunna langkung hese sareng mahal sareng langkung dipikaresep nyababkeun pangajian ditinggalkeun. Ieu tiasa ngaganggu diajar.

2. Ayeuna damel waktos ngantosan hésé.

Malah anu langkung pikasieuneun tibatan biaya koordinasi nyaéta waktos anu leungit antara shift kerja. Sedengkeun biaya koordinasi biasana diukur dina jam - waktu nu diperlukeun pikeun ngayakeun rapat, diskusi, review desain - waktos ngantosan biasana diukur dina poé, minggu atawa malah bulan! Jadwal spesialis fungsional hese saimbang sabab unggal spesialis kedah disebarkeun ka sababaraha proyék. Rapat sajam pikeun ngabahas parobihan tiasa nyandak sababaraha minggu pikeun ngalancarkeun alur kerja. Sareng saatos satuju kana parobihan, anjeun kedah ngarencanakeun padamelan anu saleresna dina konteks seueur proyék sanés anu ngeusian waktos damel spesialis. Gawé anu ngalibetkeun perbaikan kode atanapi panalungtikan anu ngan ukur peryogi sababaraha jam atanapi dinten kanggo réngsé tiasa langkung lami sateuacan sumberna sayogi. Dugi ka waktos éta, iterasi sareng diajar ditunda.

3. Ieu narrows konteks.

Divisi tanaga gawé sacara artifisial tiasa ngabatesan diajar ku ngaganjar jalma pikeun tetep dina spesialisasina. Contona, hiji élmuwan panalungtikan anu kudu tetep dina wengkuan pungsionalitasna bakal museurkeun tanaga dina experimenting kalawan tipena béda algoritma: regression, jaringan saraf, leuweung acak, jeung saterusna. Tangtosna, pilihan algoritma anu saé tiasa nyababkeun paningkatan tambahan, tapi biasana langkung seueur anu dimeunangkeun tina kagiatan sanés, sapertos ngahijikeun sumber data énggal. Kitu ogé, éta bakal ngabantosan ngembangkeun modél anu ngamangpaatkeun unggal sakedik kakuatan panjelasan anu aya dina data. Sanajan kitu, kakuatan na bisa perenahna di ngarobah fungsi obyektif atawa sayah konstrain tangtu. Ieu hese ningali atanapi ngalakukeun nalika karyana diwatesan. Kusabab élmuwan téknis ngahususkeun pikeun ngaoptimalkeun algoritma, anjeunna langkung dipikaresep pikeun ngalakukeun anu sanés, sanaos kauntungan anu signifikan.

Pikeun ngaranan tanda-tanda anu muncul nalika tim élmu data meta salaku pabrik pin (contona, dina apdet status basajan): "ngantosan parobahan pipa data" jeung "ngantosan sumberdaya ML Eng" mangrupakeun blocker umum. Nanging, kuring yakin yén pangaruh anu langkung bahaya nyaéta anu anjeun henteu perhatikeun, sabab anjeun moal tiasa kuciwa naon anu anjeun henteu terang. Palaksanaan anu sampurna sareng kasugemaan anu ditampi tina ngahontal efisiensi prosés tiasa nyumputkeun bebeneran yén organisasi henteu sadar kana mangpaat diajar anu aranjeunna leungit.

Solusi pikeun masalah ieu, tangtosna, nyaéta ngaleungitkeun metode pin pabrik. Pikeun ngadorong diajar sareng iterasi, peran data scientist kedah umum tapi kalayan tanggung jawab anu lega bebas tina fungsi téknis, nyaéta ngatur élmuwan data supados dioptimalkeun pikeun diajar. Ieu ngandung harti nyewa "spesialis tumpukan pinuh" -spésialis umum anu tiasa ngalakukeun rupa-rupa fungsi, ti konsép pikeun modeling, palaksanaan pikeun pangukuran. Penting pikeun dicatet yén kuring henteu nyarankeun yén nyewa bakat full-tumpukan kedah ngirangan jumlah karyawan. Sabalikna, kuring ngan ukur nganggap yén nalika aranjeunna diatur béda, insentifna langkung saluyu sareng kauntungan diajar sareng kinerja. Contona, umpamakeun anjeun gaduh tim tilu urang sareng tilu kaahlian bisnis. Dina pabrik pin, unggal teknisi bakal bakti sapertilu waktu-Na pikeun unggal tugas pakasaban, sabab teu saurang ogé bisa ngalakukeun pakasaban maranéhanana. Dina tumpukan pinuh, unggal generalis pinuh dedicated ka sakabéh prosés bisnis, skala-up, jeung latihan.

Kalayan pangsaeutikna jalma anu ngadukung siklus produksi, koordinasi diréduksi. The generalist ngalir fluidly antara fitur, ngembangna pipa data pikeun nambahkeun leuwih data, nyobian fitur anyar dina model, deploying versi anyar pikeun produksi pikeun ukuran kausal, sarta repeating léngkah gancang-gancang ideu anyar muncul. Tangtosna, gerbong stasiun ngalaksanakeun fungsi anu béda sacara berurutan sareng henteu paralel. Barina ogé, éta ngan hiji jalma. Tapi, ngaréngsékeun tugas biasana ngan ukur butuh sakedik waktos anu diperyogikeun pikeun ngaksés sumber khusus anu sanés. Ku kituna, waktu iteration ngurangan.

Generalist urang bisa jadi teu jadi terampil salaku spesialis dina fungsi pakasaban husus, tapi urang teu narékahan pikeun kasampurnaan fungsional atawa perbaikan incremental leutik. Sabalikna, urang narékahan pikeun diajar sareng mendakan langkung seueur tantangan profésional kalayan dampak bertahap. Kalayan kontéks holistik pikeun solusi anu lengkep, anjeunna ningali kasempetan anu bakal sono ka spesialis. Anjeunna gaduh langkung seueur ide sareng langkung seueur kamungkinan. Anjeunna gagal ogé. Tapi, biaya gagalna rendah sareng mangpaat diajarna luhur. Asimétri ieu ngamajukeun iterasi gancang sareng ganjaran diajar.

Penting pikeun dicatet yén jumlah otonomi sareng kabébasan kaahlian anu dipasihkeun ka para ilmuwan tumpukan sabagéan ageung gumantung kana kateguhan platform data anu dianggo. Platform data anu dirarancang kalayan saé nyéépkeun élmuwan data tina pajeulitna wadah, pamrosésan anu disebarkeun, failover otomatis, sareng konsép komputasi canggih anu sanés. Salian abstraksi, platform data mantap bisa nyadiakeun konektipitas seamless ka infrastruktur eksperimen, ngajadikeun otomatis monitoring sarta alerting, sangkan skala otomatis tur visualisasi hasil algorithmic na debugging. Komponén ieu dirarancang sareng diwangun ku insinyur platform data, hartosna aranjeunna henteu disalurkeun ti élmuwan data ka tim pangembangan platform data. Spesialis Élmu Data mangrupikeun tanggung jawab sadaya kode anu dianggo pikeun ngajalankeun platform.

Kuring ogé, sakali kabetot dina division fungsional tanaga gawé ngagunakeun efisiensi prosés, tapi ngaliwatan trial and error (teu aya cara hadé pikeun neuleuman), kuring manggihan yén kalungguhan has hadé mempermudah learning jeung inovasi sarta nyadiakeun metrics katuhu: manggihan tur ngawangun langkung seueur kasempetan bisnis tibatan pendekatan khusus. (Cara anu langkung épéktip pikeun ngalenyepan pendekatan ieu pikeun ngatur tibatan percobaan sareng kasalahan anu kuring jalani nyaéta maca buku Kolaborasi Tim Amy Edmondson: Kumaha Organisasi Diajar, Inovasi, sareng Bersaing dina Ékonomi Pangaweruh).

Aya sababaraha asumsi penting anu tiasa ngajantenkeun pendekatan ieu pikeun ngatur langkung atanapi kirang dipercaya dina sababaraha perusahaan. Prosés iterasi ngirangan biaya trial and error. Lamun biaya kasalahan tinggi, Anjeun meureun hoyong ngurangan aranjeunna (tapi ieu teu dianjurkeun pikeun aplikasi médis atawa manufaktur). Salaku tambahan, upami anjeun ngurus petabytes atanapi exabytes data, spésialisasi dina rékayasa data tiasa diperyogikeun. Kitu ogé, upami ngajaga kamampuan bisnis online sareng kasadiaanna langkung penting tibatan ningkatkeun aranjeunna, kaunggulan fungsional tiasa langkung seueur diajar. Tungtungna, modél tumpukan pinuh ngandelkeun pendapat jalma anu terang ngeunaan éta. Aranjeunna teu unicorns; Anjeun tiasa manggihan aranjeunna atanapi nyiapkeun aranjeunna sorangan. Nanging, aranjeunna dina paménta anu luhur sareng narik sareng nahan aranjeunna ngabutuhkeun kompensasi kompetitif, nilai perusahaan anu kuat sareng padamelan anu nangtang. Pastikeun budaya perusahaan anjeun tiasa ngadukung ieu.

Sanaos sadayana nyarios, kuring yakin yén modél tumpukan pinuh nyayogikeun kaayaan awal anu pangsaéna. Mimitian ku aranjeunna, lajeng sadar pindah ka division fungsional gawé ngan lamun diperlukeun.

Aya kalemahan séjén tina spésialisasi fungsional. Ieu tiasa nyababkeun leungitna tanggung jawab sareng pasif ti pagawé. Smith dirina criticizes division buruh, nunjukkeun yen eta ngakibatkeun dulling bakat, i.e. pagawe jadi goblog jeung ditarik sabab peran maranéhanana diwatesan kana sababaraha tugas repetitive. Bari Spésialisasi bisa nyadiakeun efisiensi prosés, éta kurang kamungkinan kana mere ilham pagawe.

Sabalikna, peran anu serbaguna nyayogikeun sagala hal anu nyababkeun kapuasan padamelan: otonomi, penguasaan, sareng tujuan. Otonomi nyaeta aranjeunna henteu gumantung kana nanaon pikeun ngahontal kasuksésan. Mastery perenahna dina kaunggulan kompetitif kuat. Jeung rasa tujuan perenahna di kasempetan pikeun boga dampak dina bisnis maranéhanana nyieun. Lamun urang bisa meunang jalma bungah ngeunaan karya maranéhanana sarta boga dampak badag dina parusahaan, lajeng sagalana sejenna bakal tumiba kana tempat.

sumber: www.habr.com

Tambahkeun komentar