Эмне үчүн Data Science командаларына адистер эмес, жалпы адистер керек

Эмне үчүн Data Science командаларына адистер эмес, жалпы адистер керек
ХИРОШИ ВАТАНАБЕ/ГЕТТИ IMAGES

Адам Смит «Элдердин байлыгы» деген эмгегинде эмгекти бөлүштүрүү кантип өндүрүмдүүлүктү жогорулатуунун негизги булагы болуп калаарын көрсөтөт. Мисал катары төөнөгүч заводдун конвейерин алсак болот: «Бир жумушчу зымды тартат, экинчиси түздөйт, үчүнчүсү кесет, төртүнчүсү учун курчутат, бешинчиси экинчи учун башына туура келтирет». Конкреттүү функцияларга багытталган адистешүүнүн аркасында ар бир кызматкер өзүнүн тар ишинде жогорку квалификациялуу адиске айланат, бул процесстин натыйжалуулугун жогорулатууга алып келет. Ар бир жумушчунун продукциясы бир нече эсе кебейуп, фабрика пиндерди чыгарууда натыйжалуу боло баштайт.

Функционалдык боюнча эмгекти мындай бөлүштүрүү бүгүнкү күндө да биздин акылыбызга ушунчалык сиңип калгандыктан, биз бригадаларыбызды ошого жараша тез уюштурдук. Маалымат илими да четте калбайт. Татаал алгоритмдик бизнес мүмкүнчүлүктөрү бир нече жумуш функцияларын талап кылат, ошондуктан компаниялар адатта адистерден турган топторду түзүшөт: изилдөөчүлөр, маалымат инженерлери, машина үйрөнүү инженерлери, себеп-натыйжа боюнча окумуштуулар ж.б. Адистердин иши төөнөгүч заводуна окшош функцияларды өткөрүп берүү менен продукт менеджери тарабынан координацияланат: "бир адам маалыматтарды алат, башкасы аны моделдейт, үчүнчүсү аны аткарат, төртүнчү чара" ж.б.у.с.

Тилекке каршы, биз өндүрүмдүүлүктү жогорулатуу үчүн Data Science топторубузду оптималдаштырбашыбыз керек. Бирок, сиз муну эмне жасап жатканыңызды түшүнгөндө жасайсыз: төөнөгүч же башка нерсе, жана жөн гана натыйжалуулукту жогорулатууга умтуласыз. Жыйноо линияларынын максаты тапшырманы аткаруу болуп саналат. Биз эмнени каалап жатканыбызды так билебиз - төөнөгүчтөр (Смиттин мисалындагыдай), бирок талаптар буюмдун жана анын жүрүм-турумунун бардык аспектилерин толугу менен сүрөттөгөн ар кандай өнүм же кызматты атаса болот. Кызматкерлердин ролу бул талаптарды мүмкүн болушунча натыйжалуу аткаруу болуп саналат.

Бирок Data Scienceтин максаты тапшырмаларды аткаруу эмес. Тескерисинче, максат күчтүү жаңы бизнес мүмкүнчүлүктөрүн изилдөө жана өнүктүрүү болуп саналат. Алгоритмдик өнүмдөрдү жана кызматтарды сунуштоо системалары, кардарлардын өз ара аракеттенүүсү, стилди тандоонун классификациясы, өлчөмдөрү, кийимдин дизайны, логистикалык оптималдаштыруу, сезондук тенденцияларды аныктоо жана башка көптөгөн нерселерди алдын ала иштеп чыгуу мүмкүн эмес. Аларды изилдөө керек. Реплантациялоо үчүн эч кандай пландар жок, бул белгисиздик менен жаңы мүмкүнчүлүктөр. Коэффициенттерди, моделдерди, моделдердин түрлөрүн, гиперпараметрлерди, бардык керектүү элементтерди эксперимент, сыноо жана ката жана кайталоо аркылуу үйрөнүү керек. төөнөгүчтөр менен, окутуу жана дизайн өндүрүштүн алдын ала жүргүзүлөт. Data Science менен сиз мурункудай эмес, үйрөнгөндөй үйрөнөсүз.

Пин фабрикасында окутуу биринчи орунда турганда, биз жумушчулардын өндүрүштүн натыйжалуулугун жогорулатуудан башка буюмдун кандайдыр бир өзгөчөлүгүн импровизациялоосун күтпөйбүз жана каалабайбыз. Адистештирилген тапшырмалар мааниси бар, анткени ал процесстин натыйжалуулугуна жана өндүрүштүн ырааттуулугуна (акыркы продукцияга өзгөртүүлөрсүз) алып келет.

Бирок продукт дагы эле өнүгүп жаткан кезде жана максат окутуу болуп саналат, адистештирүү төмөнкү учурларда биздин максаттарга тоскоол болот:

1. Бул координациялык чыгымдарды көбөйтөт.

Башкача айтканда, баарлашуу, талкуулоо, негиздөө жана аткарылышы керек болгон иштердин артыкчылыктуулугун аныктоо учурунда топтолгон чыгымдар. Бул чыгымдар тартылган адамдардын саны менен супер-сызыктуу масштабда. (Дж. Ричард Хэкман бизге үйрөткөндөй, r мамилелеринин саны бул теңдемеге ылайык n мүчөлөрдүн санынын функциясына окшош өсөт: r = (n ^ 2-n)/2. Жана ар бир байланыш кандайдыр бир сумманы ачып берет. нарк мамилеси.) Маалымат илимпоздору функциялар боюнча уюшулганда, ар бир этапта, ар бир өзгөртүү, ар бир өткөрүп берүү ж. Мисалы, жаңы функцияларды сынап көргүсү келген статистикалык моделдер жаңы нерсени сынап көргүсү келген сайын маалымат топтомуна кошуп турган маалымат инженерлери менен координацияланышы керек болот. Ошо сыяктуу эле, үйрөтүлгөн ар бир жаңы модель моделди иштеп чыгуучу аны өндүрүшкө киргизүү үчүн кимдир бирөө менен координациялоону талап кылат дегенди билдирет. Координациялык чыгымдар итерация үчүн баа болуп, аларды кыйындатат жана кымбат кылат жана изилдөөдөн баш тартууга алып келет. Бул окууга тоскоол болушу мүмкүн.

2. Күтүү убактысын кыйындатат.

Координациялык чыгымдардан да оор жумуш сменаларынын ортосунда жоголгон убакыт. Координациялык чыгымдар адатта сааттар менен ченелет - жолугушууларды, талкууларды, дизайнды кароого кеткен убакыт - күтүү убактысы адатта күн, жума же айлар менен ченелет! Функционалдык адистердин графиктерин тең салмактоо кыйын, анткени ар бир адис бир нече долбоорлорго бөлүштүрүлүшү керек. Өзгөртүүлөрдү талкуулоо үчүн бир сааттык жолугушуу иш процессин жөнгө салуу үчүн бир нече жумага созулушу мүмкүн. Ал эми өзгөртүүлөр боюнча макулдашылгандан кийин, адистердин жумуш убактысын ээлеген көптөгөн башка долбоорлордун контекстинде иш жүзүндөгү ишти пландаштыруу зарыл. Кодду оңдоону же изилдөөнү камтыган жумуш бир нече саат же күндү талап кылат, ресурстар жеткиликтүү болгонго чейин бир топ убакыт талап кылынышы мүмкүн. Ага чейин кайталоо жана үйрөнүү токтотулат.

3. Контекстти тарытат.

Эмгекти белуштуруу адамдарды ез адистиги боюнча калгандыгы учун сыйлоо жолу менен окууну жасалма турде чектей алат. Мисалы, изилдөөчү илимпоз өзүнүн функционалдуулугунун чегинде калуусу керек болгон күчүн алгоритмдердин ар кандай түрлөрү менен эксперимент жүргүзүүгө багыттайт: регрессия, нейрон тармактары, кокус токой жана башкалар. Албетте, алгоритмди жакшы тандоо кадам сайын жакшырууга алып келиши мүмкүн, бирок, адатта, жаңы маалымат булактарын интеграциялоо сыяктуу башка иш-чаралардан дагы көп нерсеге ээ болот. Ошо сыяктуу эле, ал маалыматтарга мүнөздүү болгон ар бир түшүндүрмө күчүн пайдаланган моделди иштеп чыгууга жардам берет. Бирок, анын күчү объективдүү функцияны өзгөртүүдө же белгилүү бир чектөөлөрдү жеңилдетүүдө болушу мүмкүн. Анын иши чектелүү болгондо муну көрүү же жасоо кыйын. Техникалык илимпоз алгоритмдерди оптималдаштырууга адистешкендиктен, ал олуттуу пайда алып келсе дагы, башка эч нерсе кыла албайт.

Маалымат илиминин топтору пин фабрикалары катары иш алып барганда пайда болгон белгилерди аташ үчүн (мисалы, жөнөкөй статус жаңыртууларында): "маалымат түтүгүнүн өзгөрүшүн күтүү" жана "ML Eng ресурстарын күтүү" жалпы блокаторлор. Бирок, менин оюмча, эң коркунучтуу таасир - бул сиз байкабаган нерсе, анткени сиз билбеген нерсеңизге өкүнбөйсүз. Кемчиликсиз аткаруу жана процесстин эффективдүүлүгүнө жетишүүдөн алынган бейпилдик уюмдар жетишпей жаткан окуу артыкчылыктарын билишпейт деген чындыкты жаап-жашырышы мүмкүн.

Бул маселенин чечили-ши, албетте, заводдук пин методунан арылуу. Окууну жана кайталоону стимулдаштыруу үчүн, маалымат таануучунун ролдору жалпы болушу керек, бирок техникалык функциядан көз карандысыз кеңири жоопкерчиликтерге ээ болушу керек, башкача айтканда, маалымат таануучуларды окутуу үчүн оптималдаштырылгандай кылып уюштуруу керек. Бул концепциядан моделдештирүү, ишке ашыруудан өлчөөгө чейин ар кандай функцияларды аткара ала турган "толук стек адистерин" - жалпы адистерди жалдоо дегенди билдирет. Белгилей кетчү нерсе, мен толук стек таланттарды жалдоо кызматкерлердин санын азайтышы керек деп сунуш кылбайм. Тескерисинче, мен жөн гана алар башкача уюштурулганда, алардын стимулдары окуу жана аткаруунун артыкчылыктары менен жакшыраак шайкеш келет деп болжолдойм. Мисалы, сизде үч кишиден турган үч бизнес жөндөмү бар командаңыз бар дейли. Пин заводунда ар бир техник өз убактысынын үчтөн бир бөлүгүн ар бир жумуш тапшырмасына арнайт, анткени анын ишин башка эч ким аткара албайт. Толук стекте, ар бир жалпы адис толугу менен бизнес процессине, масштабын кеңейтүүгө жана окутууга арналган.

Өндүрүштүк циклди колдогон адамдар аз болгондуктан, координация азаят. Генералист функциялар арасында ыксыз кыймылдап, көбүрөөк маалымат кошуу үчүн маалымат түтүгүн кеңейтет, моделдердеги жаңы функцияларды сынайт, себептик өлчөөлөр үчүн өндүрүшкө жаңы версияларды колдонот жана жаңы идеялар пайда болгондон кийин кадамдарды тез кайталайт. Албетте, вагон ар кандай функцияларды катарлаш эмес, ырааттуу аткарат. Анткени, бул бир гана адам. Бирок, тапшырманы аткаруу, адатта, башка адистештирилген ресурска жетүү үчүн талап кылынган убакыттын бир бөлүгүн гана алат. Ошентип, кайталоо убактысы азаят.

Биздин генералдык адисибиз белгилүү бир жумуш функциясы боюнча адис катары квалификациялуу болбошу мүмкүн, бирок биз функционалдык өркүндөтүүгө же бир аз кошумча жакшыртууга умтулбайбыз. Тескерисинче, биз акырындык менен эффективдүү көбүрөөк профессионалдык кыйынчылыктарды үйрөнүүгө жана ачууга умтулабыз. Толук чечим үчүн комплекстүү контекст менен ал адис колдон чыгара турган мүмкүнчүлүктөрдү көрөт. Анын идеялары жана мүмкүнчүлүктөрү көбүрөөк. Ал да жетишпейт. Бирок, ийгиликсиздиктин баасы төмөн жана окуунун пайдасы жогору. Бул асимметрия тез итерацияга өбөлгө түзөт жана окууга сыйлык берет.

Белгилей кетчү нерсе, толук стек илимпоздоруна берилген автономия жана көндүмдөрдүн ар түрдүүлүгү негизинен иштей турган маалымат платформасынын бекемдигинен көз каранды. Жакшы иштелип чыккан маалымат платформасы маалымат илимпоздорун контейнердештирүү, бөлүштүрүлгөн иштетүү, автоматтык түрдө иштен чыгаруу жана башка өнүккөн эсептөө концепцияларынан абстракциялайт. Абстракциядан тышкары, ишенимдүү маалымат платформасы эксперименталдык инфраструктурага үзгүлтүксүз байланышты камсыздай алат, мониторингди жана эскертүүнү автоматташтырат, алгоритмдик натыйжаларды автоматтык түрдө масштабдоону жана визуализациялоону жана мүчүлүштүктөрдү оңдоону иштетет. Бул компоненттер маалымат платформасынын инженерлери тарабынан иштелип чыккан жана курулган, башкача айтканда, алар маалымат илимпозунан маалымат платформасын иштеп чыгуу тобуна берилбейт. Бул платформаны иштетүү үчүн колдонулган бардык коддор үчүн жооптуу болгон Data Science адиси.

Мен да бир кезде процесстин эффективдүүлүгүн колдонуу менен эмгекти функционалдык бөлүштүрүүгө кызыкчумун, бирок сынап көрүү жана жаңылыштык аркылуу (үйрөнүүнүн жакшы жолу жок) мен типтүү ролдор окууну жана инновацияны жакшыраак жеңилдетип, туура көрсөткүчтөрдү берерин байкадым: ачуу жана адистештирилген ыкмага караганда көбүрөөк бизнес мүмкүнчүлүктөрүн түзүү. (Мен башынан өткөргөн сыноо жана каталарга караганда уюштуруунун бул ыкмасын үйрөнүүнүн натыйжалуу жолу - Эми Эдмондсондун Команда менен кызматташуу: уюмдар билим экономикасында кантип үйрөнүшөт, инновациялар жана атаандашат) китебин окуу.

Кээ бир компанияларда аздыр-көптүр ишенимдүү уюштурууга бул ыкманы жасай турган кээ бир маанилүү божомолдор бар. Итерация процесси сыноо жана катанын баасын азайтат. Эгер катанын баасы жогору болсо, сиз аларды азайткыңыз келиши мүмкүн (бирок бул медициналык колдонмолор же өндүрүш үчүн сунушталбайт). Кошумчалай кетсек, эгер сиз петабайт же экзабайт маалыматтар менен алектенип жатсаңыз, маалымат инженериясы боюнча адистешүү талап кылынышы мүмкүн. Ошо сыяктуу эле, эгерде онлайн бизнес мүмкүнчүлүктөрүн жана алардын жеткиликтүүлүгүн сактоо аларды жакшыртуудан маанилүүрөөк болсо, функционалдык мыктылык окуудан ашып түшүшү мүмкүн. Акыр-аягы, толук стек модели бул тууралуу билген адамдардын пикирлерине таянат. Алар бир мүйүздүү эмес; аларды таап же өзүңүз даярдасаңыз болот. Бирок, алар жогорку суроо-талапка ээ жана аларды тартуу жана сактоо үчүн атаандаштык компенсация, күчтүү корпоративдик баалуулуктар жана татаал жумуш талап кылынат. Сиздин компанияңыздын маданияты муну колдоого аларын текшериңиз.

Айтылгандардын бардыгына карабастан, мен толук стек модели эң жакшы баштоо шарттарын камсыз кылат деп ишенем. Алардан баштап, анан өтө зарыл болгон учурда гана эмгекти функционалдык бөлүштүрүүгө аң-сезимдүү өтүү.

Функционалдык адистештирүүнүн башка кемчиликтери бар. Бул жумушчулардын жоопкерчилигин жоготуп, пассивдуу болушуна алып келет. Смит өзү эмгек бөлүштүрүүнү сындап, ал таланттын туңгуюгуна алып келет, б.а. жумушчулар сабатсыз болуп калышат, анткени алардын ролу бир нече кайталануучу тапшырмалар менен чектелген. Адистештирилген процесстин эффективдүүлүгүн камсыз кылганы менен, ал жумушчуларды шыктандырбайт.

Өз кезегинде, ар тараптуу ролдор жумуштан канааттанууну камсыз кылган бардык нерселерди камсыз кылат: автономия, чеберчилик жана максат. Автономия, алар ийгиликке жетүү үчүн эч нерсеге көз каранды эмес. Чеберлик күчтүү атаандаштык артыкчылыктарга ээ. Ал эми максаттын мааниси алар түзгөн бизнеске таасир тийгизүү мүмкүнчүлүгүнөн турат. Эгерде биз адамдарды өз ишине кызыктырып, компанияга чоң таасирин тийгизе алсак, анда калганынын баары ордуна келет.

Source: www.habr.com

Комментарий кошуу