Napa tim Ilmu Data butuh umum, dudu spesialis

Napa tim Ilmu Data butuh umum, dudu spesialis
HIROSHI WATANABE / GAMBAR Getty

Ing Wealth of Nations, Adam Smith nuduhake carane divisi tenaga kerja dadi sumber utama kanggo nambah produktivitas. Tuladhane baris perakitan pabrik pin: "Sawijining buruh narik kabel, liyane lurus, katelu motong, papat ngasah mburi, kalima nggiling ujung liyane kanggo pas karo sirah." Thanks kanggo spesialisasi sing fokus ing fungsi tartamtu, saben karyawan dadi spesialis sing mumpuni ing tugas sing sempit, sing nyebabake efisiensi proses tambah. Output saben buruh mundhak kaping pirang-pirang, lan pabrik dadi luwih efisien ing prodhuksi pin.

Divisi tenaga kerja miturut fungsi iki wis tertanam ing pikiran kita nganti saiki, mula kita kanthi cepet ngatur tim. Ilmu Data ora kajaba. Kapabilitas bisnis algoritmik sing rumit mbutuhake sawetara fungsi kerja, mula perusahaan biasane nggawe tim spesialis: peneliti, insinyur data, insinyur pembelajaran mesin, ilmuwan sebab-akibat, lan liya-liyane. Pakaryan spesialis dikoordinasi dening manajer produk kanthi transfer fungsi kanthi cara sing meh padha karo pabrik pin: "siji wong nampa data, model liyane, pihak katelu nindakake, langkah kaping papat" lan liya-liyane,

Sayange, kita ora kudu ngoptimalake tim Ilmu Data kanggo nambah produktivitas. Nanging, sampeyan nindakake iki nalika sampeyan ngerti apa sing sampeyan produksi: pin utawa liya-liyane, lan mung ngupayakake efisiensi. Tujuan saka garis perakitan yaiku kanggo ngrampungake tugas. Kita ngerti persis apa sing dikarepake - pin (kaya ing conto Smith), nanging produk utawa layanan apa wae bisa kasebut ing syarat-syarat kasebut kanthi lengkap nggambarake kabeh aspek produk lan prilaku. Peran karyawan yaiku ngrampungake syarat kasebut kanthi efisien.

Nanging tujuan Ilmu Data ora kanggo ngrampungake tugas. Nanging, tujuane yaiku njelajah lan ngembangake kesempatan bisnis anyar sing kuwat. Produk lan layanan algoritma kayata sistem rekomendasi, interaksi pelanggan, klasifikasi preferensi gaya, ukuran, desain busana, optimasi logistik, deteksi tren musiman lan liya-liyane ora bisa dikembangake luwih dhisik. Padha kudu sinau. Ora ana cithak biru sing kudu ditiru, iki minangka kemungkinan anyar kanthi kahanan sing durung mesthi. Koefisien, model, jinis model, hiperparameter, kabeh unsur sing perlu kudu dipelajari liwat eksperimen, nyoba lan kesalahan, lan pengulangan. Kanthi pin, latihan lan desain ditindakake sadurunge produksi. Kanthi Ilmu Data, sampeyan sinau kaya sing ditindakake, dudu sadurunge.

Ing pabrik pin, nalika latihan luwih dhisik, kita ora ngarep-arep utawa ora pengin para pekerja nggawe improvisasi babagan fitur produk liyane kajaba nambah efisiensi produksi. Tugas spesialisasi ndadekake akal amarga ndadΓ©kakΓ© efisiensi proses lan konsistensi produksi (tanpa owah-owahan ing produk pungkasan).

Nanging nalika produk isih berkembang lan tujuane latihan, spesialisasi ngganggu tujuan kita ing kasus ing ngisor iki:

1. Iku mundhak biaya koordinasi.

Tegese, biaya-biaya sing dikumpulake sajrone wektu kanggo komunikasi, ngrembug, mbenerake lan ngutamakake karya sing kudu ditindakake. Biaya iki ukuran super-linear karo jumlah wong sing melu. (Minangka J. Richard Hackman mulang kita, jumlah hubungan r mundak akeh padha kanggo fungsi saka jumlah istilah n miturut persamaan iki: r = (n ^ 2-n) / 2. Lan saben sesambetan marang sawetara jumlah saka hubungan biaya.) Nalika ilmuwan data diatur kanthi fungsi, ing saben tahapan, kanthi saben owah-owahan, saben serah terima, lan liya-liyane, akeh spesialis sing dibutuhake, sing nambah biaya koordinasi. Contone, model statistik sing pengin eksprimen karo fitur-fitur anyar kudu koordinasi karo insinyur data sing nambah set data saben-saben pengin nyoba sing anyar. Kajaba iku, saben model anyar sing dilatih tegese pangembang model mbutuhake wong sing bisa koordinasi kanggo nggawe produksi. Biaya koordinasi tumindak minangka rega kanggo iterasi, dadi luwih angel lan larang lan luwih bisa nyebabake studi kasebut ditinggalake. Iki bisa ngganggu sinau.

2. Iku ndadekake wektu nunggu angel.

Malah luwih nggegirisi tinimbang biaya koordinasi yaiku wektu sing ilang ing antarane shift kerja. Nalika biaya koordinasi biasane diukur ing jam - wektu sing dibutuhake kanggo nganakake rapat, diskusi, review desain - wektu ngenteni biasane diukur ing dina, minggu utawa malah sasi! Jadwal spesialis fungsional angel diimbangi amarga saben spesialis kudu disebar ing pirang-pirang proyek. Rapat siji jam kanggo ngrembug owah-owahan bisa njupuk minggu kanggo lancar alur kerja. Lan sawise nyetujoni owah-owahan, perlu kanggo ngrancang karya nyata dhewe ing konteks akeh proyek liyane sing manggoni wektu kerja spesialis. Pakaryan sing nglibatake mbenakake kode utawa riset sing mung butuh sawetara jam utawa dina kanggo ngrampungake bisa luwih suwe sadurunge sumber daya kasedhiya. Nganti saiki, pengulangan lan sinau digantung.

3. Narrows konteks.

Divisi tenaga kerja bisa mbatesi sinau kanthi artifisial kanthi menehi hadiah marang wong sing tetep ing spesialisasine. Contone, ilmuwan riset sing kudu tetep ing ruang lingkup fungsine bakal fokus energi ing eksperimen karo macem-macem jinis algoritma: regresi, jaringan syaraf, alas acak, lan sapiturute. Mesthi, pilihan algoritma sing apik bisa nyebabake paningkatan tambahan, nanging biasane luwih akeh sing bisa dipikolehi saka aktivitas liyane, kayata nggabungake sumber data anyar. Kajaba iku, bakal mbantu ngembangake model sing nggunakake kabeh kekuwatan panjelasan sing ana ing data kasebut. Nanging, kekuwatane bisa uga ana ing ngganti fungsi objektif utawa ngilangi kendala tartamtu. Iki angel dideleng utawa ditindakake nalika pakaryane diwatesi. Amarga ilmuwan teknis khusus kanggo ngoptimalake algoritma, dheweke ora bisa nindakake apa-apa, sanajan entuk manfaat sing signifikan.

Kanggo menehi jeneng pratandha sing katon nalika tim ilmu data tumindak minangka pabrik pin (contone, ing nganyari status prasaja): "nunggu owah-owahan pipa data" lan "nunggu sumber daya ML Eng" blockers umum. Nanging, aku yakin pengaruh sing luwih mbebayani yaiku apa sing sampeyan ora weruh, amarga sampeyan ora bisa nyesel apa sing durung dingerteni. Eksekusi tanpa cacat lan kepuasan sing dipikolehi saka entuk efisiensi proses bisa nutupi kasunyatan manawa organisasi ora ngerti babagan keuntungan latihan sing ilang.

Solusi kanggo masalah iki, mesthi, kanggo nyisihake cara pin pabrik. Kanggo nyengkuyung sinau lan iterasi, peran ilmuwan data kudu umum nanging kanthi tanggung jawab sing wiyar ora gumantung saka fungsi teknis, yaiku ngatur ilmuwan data supaya dioptimalake kanggo sinau. Iki tegese nyewa "spesialis tumpukan lengkap" - spesialis umum sing bisa nindakake macem-macem fungsi, saka konsep kanggo model, implementasine kanggo pangukuran. Wigati dimangerteni manawa aku ora menehi saran manawa nyewa bakat tumpukan lengkap kudu nyuda jumlah karyawan. Nanging, aku mung bakal nganggep yen diatur kanthi cara sing beda, insentif kasebut luwih cocog karo keuntungan sinau lan kinerja. Contone, umpamane sampeyan duwe tim telu wong kanthi telung katrampilan bisnis. Ing pabrik pin, saben teknisi bakal nyawisake kaping telune wektu kanggo saben tugas, amarga ora ana wong liya sing bisa nindakake pakaryane. Ing tumpukan lengkap, saben generalis wis darmabakti kanggo kabeh proses bisnis, skala-up, lan latihan.

Kanthi luwih sithik wong sing ndhukung siklus produksi, koordinasi suda. Generalist gerakane fluidly antarane fitur, ngembangaken pipeline data kanggo nambah data liyane, nyoba fitur anyar ing model, deploying versi anyar kanggo produksi kanggo pangukuran kausal, lan mbaleni langkah-langkah minangka cepet gagasan anyar teka. Mesthi, gerbong stasiun nindakake fungsi sing beda-beda kanthi urutan lan ora sejajar. Sawise kabeh, iku mung siji wong. Nanging, ngrampungke tugas biasane mung butuh sekedhik wektu sing dibutuhake kanggo ngakses sumber khusus liyane. Dadi, wektu pengulangan suda.

Generalist kita bisa uga ora trampil minangka spesialis ing fungsi proyek tartamtu, nanging kita ora usaha kanggo kesempurnaan fungsi utawa dandan tambahan cilik. Nanging, kita ngupayakake sinau lan nemokake tantangan profesional liyane kanthi pengaruh bertahap. Kanthi konteks sakabehe kanggo solusi lengkap, dheweke ndeleng kesempatan sing bakal dilewati dening spesialis. Dheweke duwe luwih akeh gagasan lan luwih akeh kemungkinan. Dheweke uga gagal. Nanging, biaya kegagalan kurang lan entuk manfaat saka sinau dhuwur. Asimetri iki ningkatake pengulangan kanthi cepet lan menehi ganjaran sinau.

Wigati dimangerteni manawa jumlah otonomi lan keragaman katrampilan sing diwenehake kanggo ilmuwan tumpukan lengkap gumantung banget marang kekuwatan platform data sing bisa digunakake. Platform data sing dirancang kanthi apik nggambarake para ilmuwan data saka kerumitan containerization, pangolahan sing disebarake, failover otomatis, lan konsep komputasi canggih liyane. Saliyane abstraksi, platform data sing kuat bisa nyedhiyakake konektivitas sing lancar menyang infrastruktur eksperimen, ngotomatisasi lan menehi tandha, ngaktifake skala otomatis lan visualisasi asil algoritma lan debugging. Komponen kasebut dirancang lan dibangun dening insinyur platform data, tegese ora diwarisake saka ilmuwan data menyang tim pangembangan platform data. Spesialis Ilmu Data sing tanggung jawab kanggo kabeh kode sing digunakake kanggo mbukak platform kasebut.

Aku uga nate kasengsem ing divisi fungsional tenaga kerja kanthi nggunakake efisiensi proses, nanging liwat nyoba lan kesalahan (ora ana cara sing luwih apik kanggo sinau), aku nemokake yen peran khas luwih nggampangake sinau lan inovasi lan nyedhiyakake metrik sing bener: nemokake lan mbangun luwih akeh kesempatan bisnis tinimbang pendekatan khusus. (Cara sing luwih efektif kanggo sinau babagan pendekatan iki kanggo ngatur tinimbang nyoba lan kesalahan sing daklakoni yaiku maca buku Kolaborasi Tim Amy Edmondson: Cara Organisasi Sinau, Inovasi, lan Saingan ing Ekonomi Pengetahuan).

Ana sawetara asumsi penting sing bisa nggawe pendekatan iki kanggo ngatur luwih utawa kurang dipercaya ing sawetara perusahaan. Proses pengulangan nyuda biaya nyoba lan kesalahan. Yen biaya kesalahan dhuwur, sampeyan bisa uga pengin nyuda (nanging iki ora dianjurake kanggo aplikasi medis utawa manufaktur). Kajaba iku, yen sampeyan ngurusi petabyte utawa exabyte data, spesialisasi ing teknik data bisa uga dibutuhake. Kajaba iku, yen njaga kapabilitas bisnis online lan kasedhiyan luwih penting tinimbang nambah, keunggulan fungsional bisa uga ngluwihi sinau. Pungkasan, model tumpukan lengkap gumantung marang panemu wong sing ngerti babagan iki. Padha ora unicorns; sampeyan bisa nemokake utawa nyiyapake dhewe. Nanging, dheweke akeh dikarepake lan narik lan nahan dheweke bakal mbutuhake ganti rugi sing kompetitif, nilai perusahaan sing kuwat lan karya sing tantangan. Priksa manawa budaya perusahaan sampeyan bisa ndhukung iki.

Malah karo kabeh sing ngandika, Aku pracaya model tumpukan lengkap menehi kahanan wiwitan paling. Mulai karo wong-wong mau, lan banjur kanthi sadar pindhah menyang divisi fungsional mung yen pancen perlu.

Ana kekurangan liyane saka spesialisasi fungsional. Iki bisa nyebabake kelangan tanggung jawab lan pasif ing bagean buruh. Smith dhewe ngritik divisi saka pegawe, nyaranke sing ndadΓ©kakΓ© kanggo dulling saka talent, i.e. buruh dadi bodho lan mundur amarga peran sing diwatesi kanggo sawetara tugas bola-bali. Nalika spesialisasi bisa nyedhiyakake efisiensi proses, kurang bisa menehi inspirasi kanggo para pekerja.

Sabanjure, peran serbaguna nyedhiyakake kabeh perkara sing nyebabake kepuasan kerja: otonomi, penguasaan, lan tujuan. Otonomi yaiku ora gumantung marang apa wae kanggo nggayuh sukses. Mastery dumunung ing kaluwihan competitive kuwat. Lan rasa tujuane ana ing kesempatan kanggo nduwe pengaruh ing bisnis sing digawe. Yen kita bisa nggawe wong bungah babagan pakaryane lan duwe pengaruh gedhe ing perusahaan, mula kabeh bakal kedadeyan.

Source: www.habr.com

Add a comment