ProHoster > Blog > Идораи > Муҳандиси маълумот ва олими маълумот: фарқият дар чист?
Муҳандиси маълумот ва олими маълумот: фарқият дар чист?
Касбҳои олими маълумот ва муҳандиси маълумот аксар вақт ошуфта мешаванд. Ҳар як ширкат дорои хусусиятҳои хоси кор бо маълумот, мақсадҳои гуногуни таҳлили онҳо ва ақидаи гуногун дар бораи он, ки кадом мутахассис бояд бо кадом қисми кор сарукор дошта бошад, аз ин рӯ ҳар кадоми онҳо талаботи худро дорад.
Дар маколаи якум Елена Герасимова, мудири кафедраи «Илми маълумот ва таҳлил" дар Netology мегӯяд, ки фарқияти байни як олими маълумот ва муҳандиси додаҳо чист ва онҳо бо кадом асбобҳо кор мекунанд.
Роли муҳандисон ва олимон чӣ гуна фарқ мекунанд
Муҳандиси додаҳо мутахассисест, ки аз як тараф инфрасохтори додаҳоро таҳия, озмоиш ва нигоҳдорӣ мекунад: пойгоҳи додаҳо, системаҳои нигоҳдорӣ ва коркарди омма. Аз тарафи дигар, маҳз ҳамон касест, ки маълумотро барои истифода аз ҷониби таҳлилгарон ва олимони маълумот тоза ва "шона" мекунад, яъне қубурҳои коркарди маълумотро эҷод мекунад.
Data Scientist бо истифода аз алгоритмҳои омӯзиши мошинсозӣ ва шабакаҳои нейронӣ моделҳои пешгӯишаванда (ва дигар) эҷод ва таълим медиҳад, ки ба тиҷорат дар ёфтани намунаҳои пинҳон, пешгӯии пешрафтҳо ва оптимизатсияи равандҳои асосии тиҷорат кӯмак мекунад.
Фарқи асосии байни олими маълумот ва муҳандиси маълумот дар он аст, ки онҳо одатан ҳадафҳои гуногун доранд. Ҳарду барои таъмини дастрас будани маълумот ва сифати баланд кор мекунанд. Аммо як олими маълумот ба саволҳои худ ҷавоб меёбад ва гипотезаҳоро дар экосистемаи додаҳо месанҷад (масалан, дар асоси Hadoop) ва муҳандиси додаҳо лӯлаи хидматрасонии алгоритми омӯзиши мошинро эҷод мекунад, ки аз ҷониби як олими маълумот дар кластери Spark дар дохили ҳамон як олим навишта шудааст. экосистема.
Муҳандиси маълумот тавассути кор дар як гурӯҳ ба тиҷорат арзиш меорад. Вазифаи он аз он иборат аст, ки ҳамчун як пайванди муҳим байни иштирокчиёни гуногун: аз таҳиягарон то истеъмолкунандагони тиҷоратии ҳисоботдиҳӣ ва баланд бардоштани ҳосилнокии таҳлилгарон, аз маркетинг ва маҳсулот то BI.
Баръакс, олими маълумот дар стратегияи ширкат ва истихроҷи фаҳмиш, қабули қарорҳо, татбиқи алгоритмҳои автоматикунонӣ, моделсозӣ ва тавлиди арзиш аз додаҳо фаъолона иштирок мекунад.
Кор бо додаҳо ба принсипи GIGO (garbage in - garbage out) вобаста аст: агар таҳлилгарон ва олимони маълумот бо маълумоти омодананашуда ва эҳтимолан нодуруст кор кунанд, натиҷаҳо ҳатто бо истифода аз алгоритмҳои мураккабтарини таҳлил нодуруст хоҳанд буд.
Муҳандисони маълумот ин мушкилотро тавассути сохтани қубурҳо барои коркард, тоза ва табдил додани маълумот ҳал мекунанд ва ба олимони маълумот имкон медиҳанд, ки бо маълумоти баландсифат кор кунанд.
Дар бозор асбобҳои зиёде барои кор бо додаҳо мавҷуданд, ки ҳар марҳиларо дар бар мегиранд: аз пайдоиши маълумот то баромад то панели идоракунӣ барои шӯрои директорон. Ва муҳим аст, ки қарори истифодаи онҳо аз ҷониби муҳандис қабул карда мешавад - на аз он сабаб, ки он муд аст, балки барои он ки вай воқеан ба кори дигар иштирокчиёни раванд кӯмак мекунад.
Ба таври анъанавӣ: агар ба ширкат лозим ояд, ки робитаи байни BI ва ETL - боркунии маълумот ва навсозии ҳисоботҳо, дар ин ҷо як заминаи маъмулии меросӣ аст, ки муҳандиси маълумот бояд бо он мубориза барад (хуб аст, агар дар даста меъмор низ бошад).
Масъулиятҳои муҳандиси маълумот
Рушд, сохтмон ва нигоҳдории инфрасохтори коркарди маълумот.
Муносибати хатогиҳо ва эҷоди қубурҳои боэътимоди коркарди додаҳо.
Қарорҳои саноатии SAS ва SPSS маъмуланд, дар ҳоле ки Tableau, Rapidminer, Stata ва Julia инчунин аз ҷониби олимони маълумот барои вазифаҳои маҳаллӣ васеъ истифода мешаванд.
Қобилияти сохтани қубурҳо ба таҳлилгарон ва олимони маълумот ҳамагӣ чанд сол пеш пайдо шуда буд: масалан, тавассути скриптҳои нисбатан содда фиристодани маълумот ба нигаҳдории PostgreSQL аллакай имконпазир аст.