Kumaha ngakuan charlatan tina Data Science?

Kumaha ngakuan charlatan tina Data Science?
Anjeun meureun geus ngadéngé analis, learning mesin jeung spesialis kecerdasan jieunan, tapi anjeun geus ngadéngé jalma anu unfairly overpaid? Papanggih data charlatan! Hacks ieu, lured ku jobs lucrative, masihan élmuwan data nyata ngaran goréng. Dina materi urang ngartos kumaha carana mawa jalma sapertos ka cai bersih.

Data charlatans aya dimana-mana

Data charlatans anu jadi alus dina nyumput dina tetempoan polos nu bisa janten salah sahijinatanpa disadari. Kasempetan, organisasi anjeun parantos nyéépkeun jalma-jalma anu licik ieu mangtaun-taun, tapi warta anu saé nyaéta aranjeunna gampang diidentipikasi upami anjeun terang naon anu kedah dipilarian.
Tanda peringatan kahiji nyaéta kurangna pamahaman éta analytics jeung statistik mangrupakeun disiplin pisan béda. Kuring bakal ngajelaskeun ieu salajengna.

disiplin béda

Ahli statistik dilatih pikeun narik kacindekan ngeunaan naon anu saluareun datana, analis dilatih pikeun nalungtik eusi set data. Dina basa sejen, analis nyieun conclusions ngeunaan naon dina data maranéhanana, sarta statistikawan nyieun conclusions ngeunaan naon teu aya dina data. Analis ngabantosan anjeun naroskeun patarosan anu saé (nyieun hipotesis), sareng ahli statistik ngabantosan anjeun kéngingkeun jawaban anu saé (nguji hipotésis anjeun).

Aya ogé peran hibrida aneh dimana hiji jalma nyoba diuk dina dua korsi ... Naha henteu? Prinsip dasar élmu data: upami anjeun nuju kaayaan kateupastian, anjeun moal tiasa nganggo sami titik data pikeun hipotésis jeung nguji. Nalika data diwatesan, kateupastian maksakeun pilihan antara statistik atanapi analitik. Panjelasan di dieu.

Tanpa statistik, anjeun bakal nyangkut jeung teu bisa ngarti naha judgment nu kakarék dirumuskeun nahan nepi, sarta tanpa analisa, anjeun pindah ambing, kalawan saeutik kasempetan pikeun taming kanyahoan. Ieu pilihan hésé.

Cara tukang sihir pikeun kaluar tina kekacauan ieu nyaéta teu malire teras pura-pura kaget ku anu ngadadak. Logika balik nguji hipotesis statistik asalna handap pikeun sual naha data kaget urang cukup pikeun ngarobah pikiran urang. Kumaha urang tiasa kaget ku data upami urang parantos ningali?

Iraha tukang sihir mendakan pola, aranjeunna diideuan, teras parios data sarua keur pola anu sarua, Pikeun nyebarkeun hasil kalawan sah p-nilai atawa dua, gigireun téori maranéhna. Ku kituna, aranjeunna bohong ka anjeun (jeung, meureun, ka dirina ogé). P-nilai ieu henteu masalah upami anjeun henteu lengket kana hipotésis anjeun ka kumaha anjeun nempo data anjeun. Charlatans niru tindakan analis sareng statistikawan tanpa ngartos alesanana. Hasilna, sakabéh widang élmu data meunang reputasi goréng.

Ahli statistika leres sok ngadamel kasimpulan sorangan

Hatur nuhun kana reputasi ampir mistis tina statistikawan pikeun alesan rigorous maranéhanana, jumlah informasi palsu dina Élmu Data aya di luhur sadaya-waktu. Gampang nipu sareng henteu katangkep, khususna upami korban anu teu curiga nganggap éta sadayana ngeunaan persamaan sareng data. Dataset mangrupikeun set data, leres? No. Éta penting kumaha anjeun ngagunakeunana.

Kabeneran, anjeun ngan butuh hiji clue pikeun nyekel charlatans: aranjeunna "retroactively manggihan Amérika". Ku mendakan deui fénoména anu aranjeunna terang aya dina data.

Teu kawas charlatans, analis alus anu kabuka-dipikiran tur ngarti yén gagasan inspirational bisa mibanda loba guaran béda. Dina waktos anu sami, ahli statistik anu saé sacara saksama netepkeun kacindekan sateuacan aranjeunna ngadamel.

Analis anu dibebaskeun tina liability ... salami aranjeunna tetep dina lingkup data maranéhanana. Upami aranjeunna kagoda pikeun ngaku hiji hal anu aranjeunna henteu ningali, éta mangrupikeun padamelan sanés. Aranjeunna kedah nyabut sapatu analis sareng ngagem sapatu ahli statistik. Barina ogé, euweuh urusan naon judul pakasaban resmi, teu aya aturan nu nyebutkeun anjeun teu bisa diajar duanana profesi lamun hayang. Ngan ulah bingung aranjeunna.

Ngan kusabab anjeun saé dina statistik sanés hartosna anjeun saé dina analytics, sareng sabalikna. Lamun batur nyoba ngabejaan Anjeun disebutkeun, Anjeun kudu waspada. Upami jalma ieu nyarioskeun yén diidinan nyandak kasimpulan statistik tina data anu anjeun parantos diajar, ieu mangrupikeun alesan pikeun waspada.

katerangan aneh

Nalika niténan data charlatans di alam liar, anjeun bakal aya bewara yén maranéhna resep nyieun carita fantastis pikeun "ngajelaskeun" data aranjeunna niténan. Beuki akademik, langkung saé. Henteu masalah carita ieu disaluyukeun dina hindsight.

Nalika charlatans ngalakukeun ieu - hayu atuh jadi jelas - aranjeunna bohong. Taya jumlah persamaan atawa konsép fancy bisa nyieun pikeun kanyataan yén maranéhna nawiskeun enol bukti téori maranéhanana. Tong héran ku katerangan anu teu biasa.

Ieu sami sareng nunjukkeun kamampuan "psikis" anjeun ku ningali heula kartu dina panangan anjeun teras ngaramalkeun naon anu anjeun tahan ... naon anu anjeun tahan. Ieu bias hindsight, sarta profési élmu data dieusian nepi ka penggir jeung eta.

Kumaha ngakuan charlatan tina Data Science?

Analis nyarios: "Anjeun nembé angkat sareng Ratu Inten." Ahli statistik nyarios, "Kuring nyerat hipotesis kuring dina salembar kertas ieu sateuacan urang ngamimitian. Hayu urang muter-muter sareng ningali sababaraha data sareng tingali upami kuring leres." Charlatans nyarios: "Kuring terang anjeun bakal janten Ratu Inten ieu kusabab ..."

Babagi data mangrupikeun perbaikan gancang anu diperyogikeun ku sadayana.

Nalika henteu seueur data, anjeun kedah milih antara statistik sareng analitik, tapi nalika aya langkung ti cukup data, aya kasempetan anu hadé pikeun ngagunakeun analitik tanpa tipu daya. и statistik. Anjeun gaduh pertahanan anu sampurna ngalawan charlatans - pamisahan data sareng, dina pamanggih kuring, ieu mangrupikeun ide anu paling kuat dina Élmu Data.

Pikeun ngajaga diri tina charlatans, sadaya anu anjeun kedah laksanakeun nyaéta mastikeun yén anjeun nyimpen sababaraha data tés kaluar tina jangkauan panonna, teras ngubaran sésana salaku analitik. Lamun anjeun datang di sakuliah téori yén anjeun dina resiko narima, make eta pikeun evaluate kaayaan, lajeng nembongkeun data test rusiah anjeun pikeun pariksa yen teori teu omong kosong. Ieu jadi basajan!

Kumaha ngakuan charlatan tina Data Science?
Pastikeun yén teu aya anu diidinan ningali data tés salami fase eksplorasi. Jang ngalampahkeun ieu, lengket data panalungtikan. Data tés teu kedah dianggo pikeun analisis.

Ieu mangrupikeun léngkah anu ageung tina anu biasa jalma-jalma dina jaman "data leutik", dimana anjeun kedah ngajelaskeun kumaha anjeun terang naon anu anjeun terang supados tungtungna ngayakinkeun jalma yén anjeun leres-leres terang hiji hal.

Larapkeun aturan anu sami pikeun ML / AI

Sababaraha charlatans posing salaku ahli ML / AI oge gampang titik. Anjeun bakal néwak aranjeunna dina cara anu sami sareng anjeun bakal nangkep insinyur anu sanés: "solusi" anu aranjeunna nyobian ngawangun terus gagal. Tanda peringatan awal nyaéta kurangna pangalaman sareng basa pemrograman standar industri sareng perpustakaan.

Tapi kumaha upami jalma anu nyiptakeun sistem anu sigana jalan? Kumaha anjeun terang upami aya anu curiga? Aturan anu sarua lumaku! Charlatan mangrupikeun karakter anu jahat anu nunjukkeun ka anjeun kumaha modélna damel ... dina data anu sami anu aranjeunna dianggo pikeun nyiptakeun modél.

Upami anjeun parantos ngawangun sistem pembelajaran mesin anu luar biasa rumit, kumaha anjeun terang kumaha saé éta? Anjeun moal terang dugi ka nunjukkeun anjeunna damel sareng data énggal anu anjeunna henteu kantos ningali.

Lamun anjeun nempo data saméméh forecasting - éta saperti teu mirip sateuacannyaritakeun

Nalika anjeun gaduh data anu cukup pikeun misahkeun, anjeun henteu kedah nyebatkeun kaéndahan rumus anjeun pikeun menerkeun proyék éta (kabiasaan fashion anu lami kuring ningali dimana-mana, sanés ngan ukur dina élmu). Anjeun tiasa nyarios: "Kuring terang éta tiasa dianggo kusabab kuring tiasa nyandak set data anu kuring henteu acan ningali sateuacanna sareng ngaduga naon anu bakal kajadian di dinya ... sareng kuring bakal leres. Deui-deui".

Nguji modél / téori anjeun ngalawan data anyar mangrupikeun dasar anu pangsaéna pikeun kapercayaan.

Kuring teu tolerate data charlatans. Abdi henteu paduli upami pendapat anjeun dumasar kana trik anu béda. Abdi henteu kagum ku kaéndahan katerangan. Tunjukkeun ka kuring yén téori / modél anjeun tiasa dianggo (sareng terus dianggo) dina sakumpulan data énggal anu anjeun teu acan kantos ningali. Ieu tés nyata kakuatan pamadegan anjeun.

Ngahubungan Data Élmu Ahli

Upami anjeun hoyong dianggap serius ku sadayana anu ngartos humor ieu, lirén nyumput di tukangeun persamaan fancy pikeun ngadukung bias pribadi. Témbongkeun kuring naon anu anjeun gaduh. Upami anjeun hoyong jalma anu "meunangna" ningali téori / modél anjeun langkung ti ngan ukur sajak inspirational, gaduh kawani pikeun nunjukkeun kumaha cara gawéna dina set data anu énggal ... di payuneun saksi. !

Banding ka pamingpin

Nolak nyandak sacara serius "gagasan" ngeunaan data dugi ka diuji anyar data. Teu ngarasa kawas nempatkeun dina usaha? Lengket kana analitik, tapi ulah ngandelkeun ideu ieu — aranjeunna henteu tiasa dipercaya sareng teu acan diuji pikeun reliabilitas. Leuwih ti éta, nalika hiji organisasi boga data dina kaayaanana, euweuh downside mun nyieun separation fundamental dina elmu jeung ngajaga eta di tingkat infrastruktur ku ngadalikeun aksés ka nguji data pikeun statistik. Ieu mangrupikeun cara anu saé pikeun ngeureunkeun jalma anu nyobian ngabobodo anjeun!

Upami anjeun hoyong ningali langkung seueur conto charlatans dugi ka henteu saé - Ieu mangrupikeun thread anu saé dina Twitter.

hasil

Lamun aya teuing saeutik data pikeun misahkeun, ngan hiji charlatan nyoba mastikeun nuturkeun inspirasi ku manggihan America retrospectively, matematis rediscovering fenomena geus dipikawanoh dina data, sarta nelepon kejutan signifikan sacara statistik. Ieu ngabédakeun aranjeunna tina analis anu terbuka, anu ngurus inspirasi, sareng ahli statistik anu taliti, anu nawiskeun bukti nalika ngadamel ramalan.

Lamun aya loba data, meunang kana kabiasaan misahkeun data sangkan anjeun bisa boga pangalusna duanana alam! Pastikeun pikeun ngalakukeun analytics sareng statistik sacara misah pikeun sawaréh individu tina tumpukan data asli.

  • analis nawiskeun anjeun inspirasi sareng open-mindedness.
  • Statistik nawiskeun anjeun nguji rigorous.
  • Urang sunda nawarkeun maneh hindsight twisted nu pretends jadi analytics tambah statistik.

Panginten, saatos maca tulisan éta, anjeun bakal mikir "Naha kuring tukang sihir"? Ieu sae. Aya dua cara pikeun ngaleungitkeun pamikiran ieu: kahiji, tingali deui, tingali naon anu anjeun laksanakeun, naha padamelan anjeun sareng data parantos nyandak kauntungan praktis. Jeung Bréh, anjeun masih bisa ngerjakeun kualifikasi anjeun (anu pasti moal superfluous), utamana saprak urang masihan murid urang kaahlian praktis tur pangaweruh anu ngamungkinkeun aranjeunna pikeun jadi élmuwan data nyata.

Kumaha ngakuan charlatan tina Data Science?

Langkung kursus

Maca deui

sumber: www.habr.com

Tambahkeun komentar