“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Dmitry Kazakov, Mpitarika ny ekipan'ny Data Analytics ao amin'ny Kolesa Group, mizara hevitra avy amin'ny fanadihadiana voalohany an'i Kazakhstan momba ireo matihanina momba ny angona.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?
Ao amin'ny sary: ​​Dmitry Kazakov

Tsarovy ilay andian-teny malaza hoe ny Big Data dia tena mitovy amin'ny firaisana ara-nofo amin'ny zatovo - miresaka momba izany ny rehetra, saingy tsy misy mahalala raha tena misy izany. Toy izany koa no azo lazaina momba ny tsenan'ny manam-pahaizana manokana momba ny data (any Kazakhstan) - misy ny hype, saingy iza no ao ambadik'izany (ary raha misy olona any) dia tsy mazava tsara - na ho an'ny HR, na ho an'ny mpitantana, na ho an'ny ny mpahay siansa momba ny data mihitsy.

Lany izahay fianarana, izay nanadihadian'izy ireo manampahaizana manokana mihoatra ny 300 momba ny karamany, ny asany, ny fahaizany, ny fitaovana ary ny maro hafa.

Spoiler: Eny, tena misy izy ireo, saingy tsy dia tsotra loatra ny zava-drehetra.

Fahitana tsara. Voalohany, betsaka kokoa ny mpahay siansa momba ny data noho ny nantenainay. Nahavita nanadihady olona 300 izahay, izay tsy vitan'ny mpandinika ny vokatra, ny varotra ary ny BI, fa ny injeniera ML sy DWH, izay nahafinaritra indrindra. Ny vondrona lehibe indrindra dia nahitana ireo rehetra izay mitonona ho mpahay siansa momba ny angona - izany no 36% amin'ireo namaly. Sarotra ny milaza na mahafeno ny fitakian’ny tsena izany na tsia, satria ny tsena mihitsy no miforona.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Mampisafotofoto ny fitsinjarana ny haavon'ny asa - saika mitovy amin'ny zandriny ny mpitarika sy ny mpitantana ny ekipa. Mety misy antony maromaro mahatonga izany. Ohatra, ekipa kely maromaro misy olona 2-3, izay mety ho manam-pahaizana manokana amin'ny ambaratonga antonony na ambony.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Antony iray hafa mety ho ny savorovoro manjaka eo amin'ny tsena amin'izao fotoana izao momba ny fenitra amin'ny fizarana andraikitra sy fiasa. Ny mpitarika ny ekipa indraindray dia omena an'ireo izay miasa herintaona na roa mihoatra noho ny hafa, tsy misy firesahana momba ny haavon'ny fahaiza-manao sy ny fahalalana. Hitantsika izany amin'ny fizarana ny asa amin'ny toerana - 38% amin'ny mpitantana sy mpitarika ny ekipa dia mirotsaka amin'ny fanodinana mialoha ary 33% hafa amin'ny fanadihadiana statistika fototra.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Eto izahay dia nangataka ireo mpamaly mba hanombantombana ny haavon'ny analytics ao amin'ny orinasany. Raha mijery akaiky ianao dia hitanao fa ny 10% amin'ireo mpamaly izay miasa ao amin'ny sampana analyse an'ny olona 2-3 dia mino fa manana "ambaratonga mandroso" izy ireo.

Inona no atao hoe "avo lenta"? Ny rafitra BI dia miasa tsara. Misy DWH sy Big Data. Ny fitiliana A/B dia atao tsy tapaka. Misy rafitra ML sy DS miasa amin'ny famokarana. Ny fanapahan-kevitra dia mifototra amin'ny angona ihany. Ny sampan-draharahan'ny fanodinana data sy ny siansa momba ny data dia iray amin'ireo lehibe indrindra ao amin'ny orinasa.

Saika tsy azo atao ny manatratra ireo rehetra voalaza etsy ambony ireo miaraka amin'ny departemanta misy olona 2-3. Heveriko fa fanaintainana kely mihamitombo ity valin'ny fanadihadiana ity - mbola tsy manana olona hampitaha ny tenany amin'ny tenany ny bandy mba hamaritana ny haavony amin'ny fomba tsy miangatra.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Araka ny efa nampoizina, ny mpahay siansa momba ny data dia mandany ny ankamaroan'ny fotoanany fa tsy amin'ny matematika na ny injeniera be pitsiny, fa amin'ny fanodinana, fampidinana ary fanadiovana angon-drakitra. Ao amin'ny fanasokajiana tsirairay dia hitantsika ny preprocessing ao amin'ny top 3. Saingy zara raha mahita zavatra sarotra toy ny famolavolana modely ML na miara-miasa amin'ny Big Data ao amin'ny 3 ambony isika - eo amin'ireo injeniera ML sy DWH ihany.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Misy hevitra mampalahelo ihany koa. Ny 40% amin'ny asany no napetraky ny manampahaizana manokana. Any Kazakhstan, hatreto dia ireo orinasa sangany unicorn ihany no nanandrana ny tombontsoa azo avy amin'ny fiaraha-miasa amin'ny angon-drakitra lehibe ary nianatra ny fomba hanaovana izany tsara. Nandefa teny an-tsena izy ireo fa mahafinaritra ny Big Data sy Machine Learning, ary manaraka ny echelon faharoa, saingy tsy azony foana ny fomba fiasan'ny data. Noho izany, hitantsika fa mametraka asa ho an'ny tenany ny manam-pahaizana manokana, ary tsy fantatry ny orinasa foana izay tadiaviny.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Gaga aho fa ny 20% amin'ny manam-pahaizana manokana dia tsy mahafantatra akory raha manana Data Warehouse ny orinasany. Eny, ary miaraka amin'ny rafitra fitantanana angon-drakitra tsy dia tsara loatra ny zava-drehetra - 41% mampiasa MySQL, ary 34% hafa mampiasa PostgreSQL. Inona no mety ho dikan'izany? Miasa miaraka amin'ny angona kely izy ireo.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Ao amin'ny fanontaniana momba ny rafitra fitahirizana dia hitantsika indray ny MySQL ary na dia (!) Excel aza. Saingy mety manondro izany, ohatra, fa ny ankamaroan'ny orinasa dia tsy mbola manana fangatahana hiasa amin'ny data lehibe.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Eto indray dia tsy mazava ny zava-drehetra. Amin'ny ankapobeny, ambany kely noho ny nantenaiko ny karama.

“Eny, misy izy ireo!” Inona no ataon'ireo manam-pahaizana momba ny Data Science any Kazakhstan ary ohatrinona ny vola azony?

Amiko manokana dia sarotra amiko ny maka sary an-tsaina ny injeniera ML izay vonona hiasa amin'ny 200 tenge - mety ho intern izy. Na ny fahaizan'ny manam-pahaizana manokana toy izany dia tena malemy, na mbola sarotra ho an'ny orinasa ny manombana tsara ny asan'ny Data Science. Saingy mety midika ihany koa izany fa mbola eo am-piandohan'ny fahamatorana ny tsena. Ary rehefa mandeha ny fotoana dia hapetraka amin'ny ambaratonga sahaza kokoa ny haavon'ny karama.

Source: www.habr.com

Add a comment