Jinsi ya kutambua charlatan kutoka Sayansi ya Data?

Jinsi ya kutambua charlatan kutoka Sayansi ya Data?
Huenda umesikia kuhusu wachambuzi, wataalam wa kujifunza kwa mashine na wataalam wa akili bandia, lakini je, umesikia kuhusu wale wanaolipwa zaidi isivyo haki? Kutana data charlatan! Udukuzi huu, unaovutiwa na kazi zenye faida kubwa, huwapa wanasayansi wa data halisi jina baya. Katika nyenzo tunaelewa jinsi ya kuleta watu kama hao kwa maji safi.

Wadanganyifu wa data wako kila mahali

Wadanganyifu wa data ni wazuri sana wa kujificha mahali penye kuonekana wazi kwamba unaweza kuwa mmoja waobila hata kutambua. Kuna uwezekano kwamba shirika lako limekuwa likiwahifadhi watu hawa wajanja kwa miaka mingi, lakini habari njema ni kwamba ni rahisi kuwatambua ikiwa unajua unachotafuta.
Ishara ya kwanza ya onyo ni ukosefu wa kuelewa hilo uchambuzi na takwimu ni taaluma tofauti sana. Nitalieleza hili zaidi.

Taaluma tofauti

Wanatakwimu wamefunzwa kufanya hitimisho kuhusu kile kinachopita zaidi ya data zao, wachambuzi wanafunzwa kuchunguza maudhui ya seti ya data. Kwa maneno mengine, wachambuzi hufikia hitimisho kuhusu kile kilicho katika data zao, na wanatakwimu hufikia hitimisho kuhusu kile ambacho hakipo kwenye data. Wachambuzi hukusaidia kuuliza maswali mazuri (fanya dhahania), na wanatakwimu hukusaidia kupata majibu mazuri (jaribu dhahania zako).

Pia kuna majukumu ya mseto ya ajabu ambapo mtu anajaribu kukaa kwenye viti viwili ... Kwa nini? Kanuni ya msingi ya sayansi ya data: ikiwa unashughulika na kutokuwa na uhakika, huwezi kutumia sawa data kwa ajili ya hypotheses na majaribio. Wakati data ni chache, kutokuwa na uhakika hulazimisha chaguo kati ya takwimu au uchanganuzi. Maelezo hapa.

Bila takwimu, utakwama na kutoweza kuelewa ikiwa hukumu uliyotunga itadumu, na bila uchanganuzi, unasonga mbele kwa upofu, na nafasi ndogo ya kudhibiti haijulikani. Huu ni chaguo ngumu.

Njia ya charlatan kutoka kwa fujo hii ni kupuuza na kisha kujifanya kushangazwa na kile kinachotokea ghafla. Mantiki ya majaribio ya nadharia za takwimu inakuja kwa swali la ikiwa data inatushangaza vya kutosha kubadilisha mawazo yetu. Tunawezaje kushangazwa na data ikiwa tayari tumeiona?

Wakati wowote walaghai wanapopata muundo, wanapata msukumo, kisha angalia data sawa kwa muundo sawakuchapisha matokeo kwa thamani halali ya p au mbili, karibu na nadharia yao. Kwa hivyo, wanakudanganya (na, labda, kwao wenyewe pia). Thamani hii ya p haijalishi ikiwa hutashikamana na nadharia yako kwa jinsi ulivyotazama data yako. Charlatans huiga matendo ya wachambuzi na watakwimu bila kuelewa sababu. Matokeo yake, uwanja mzima wa sayansi ya data hupata sifa mbaya.

Wataalamu wa takwimu wa kweli daima hupata hitimisho lao wenyewe

Shukrani kwa sifa isiyoeleweka ya wanatakwimu kwa hoja zao kali, kiasi cha taarifa bandia katika Sayansi ya Data kiko juu sana. Ni rahisi kudanganya na kutonaswa, haswa ikiwa mwathirika asiye na mashaka anafikiria kuwa yote ni milinganyo na data. Seti ya data ni seti ya data, sivyo? Hapana. Ni muhimu jinsi unavyoitumia.

Kwa bahati nzuri, unahitaji kidokezo kimoja tu ili kupata walaghai: "wanagundua Amerika kwa kurudia nyuma." Kwa kugundua tena matukio ambayo tayari wanajua yapo kwenye data.

Tofauti na walaghai, wachambuzi wazuri wana nia wazi na wanaelewa kuwa mawazo ya msukumo yanaweza kuwa na maelezo mengi tofauti. Wakati huo huo, wanatakwimu wazuri hufafanua kwa uangalifu hitimisho zao kabla ya kuzifanya.

Wachanganuzi wameondolewa kwenye dhima... mradi tu wabaki ndani ya upeo wa data zao. Ikiwa wanajaribiwa kudai kitu ambacho hawakuona, hiyo ni kazi nyingine kabisa. Wavue viatu vya mchambuzi na kuvaa viatu vya mtakwimu. Baada ya yote, haijalishi jina rasmi la kazi ni nini, hakuna sheria inayosema kuwa huwezi kusoma fani zote mbili ikiwa unataka. Usiwachanganye tu.

Kwa sababu wewe ni mjuzi wa takwimu haimaanishi kuwa wewe ni hodari katika uchanganuzi, na kinyume chake. Ikiwa mtu anajaribu kukuambia vinginevyo, unapaswa kuwa mwangalifu. Ikiwa mtu huyu atakuambia kuwa inaruhusiwa kuteka hitimisho la takwimu kutoka kwa data ambayo tayari umesoma, hii ni sababu ya kuwa na tahadhari maradufu.

Maelezo ya ajabu

Unapotazama walaghai wa data porini, utagundua kuwa wanapenda kutunga hadithi za kusisimua ili "kueleza" data wanayoona. Kielimu zaidi, ni bora zaidi. Haijalishi kwamba hadithi hizi zimerekebishwa kwa mtazamo wa nyuma.

Walaghai wanapofanya hivi - wacha niseme wazi - wanadanganya. Hakuna kiasi cha milinganyo au dhana dhahania inayoweza kufidia ukweli kwamba walitoa uthibitisho sifuri wa nadharia zao. Usishangae jinsi maelezo yao yalivyo yasiyo ya kawaida.

Hii ni sawa na kuonyesha uwezo wako wa "psychic" kwa kuangalia kwanza kadi zilizo mikononi mwako na kisha kutabiri kile ulichoshikilia ... ulichoshikilia. Huu ni upendeleo wa kuangalia nyuma, na taaluma ya sayansi ya data imejaa ukingoni nayo.

Jinsi ya kutambua charlatan kutoka Sayansi ya Data?

Wachambuzi wanasema: "Ulienda tu na Malkia wa Almasi." Wanatakwimu wanasema, "Niliandika mawazo yangu kwenye karatasi hii kabla ya kuanza. Wacha tucheze na tuangalie data na tuone kama niko sawa." Charlatans anasema: "Nilijua utakuwa Malkia huyu wa Almasi kwa sababu..."

Kushiriki data ni suluhisho la haraka ambalo kila mtu anahitaji.

Wakati hakuna data nyingi, unapaswa kuchagua kati ya takwimu na analytics, lakini wakati kuna data zaidi ya kutosha, kuna fursa nzuri ya kutumia analytics bila udanganyifu. ΠΈ takwimu. Una ulinzi kamili dhidi ya walaghai - kutenganisha data na, kwa maoni yangu, hili ndilo wazo lenye nguvu zaidi katika Sayansi ya Data.

Ili kujilinda dhidi ya walaghai, unachohitaji kufanya ni kuhakikisha kuwa umeweka baadhi ya data ya majaribio mbali na macho yao ya kupenya, na kisha uwachukulie wengine kama uchanganuzi. Unapokutana na nadharia ambayo uko katika hatari ya kuikubali, itumie kutathmini hali hiyo, kisha ufichue data yako ya siri ya jaribio ili kuhakikisha kuwa nadharia hiyo si upuuzi. Ni rahisi sana!

Jinsi ya kutambua charlatan kutoka Sayansi ya Data?
Hakikisha kuwa hakuna mtu anayeruhusiwa kutazama data ya jaribio wakati wa awamu ya uchunguzi. Ili kufanya hivyo, shikilia data ya utafiti. Data ya majaribio haipaswi kutumiwa kwa uchambuzi.

Hii ni hatua kubwa kutoka kwa kile watu wamezoea katika enzi ya "data ndogo", ambapo lazima ueleze jinsi unavyojua kile unachokijua ili hatimaye kuwashawishi watu kuwa unajua kitu.

Tumia sheria sawa kwa ML/AI

Baadhi ya walaghai wanaojifanya kama wataalam wa ML/AI pia ni rahisi kuwaona. Utawakamata kwa njia ile ile ungemshika mhandisi mwingine yeyote mbaya: "suluhisho" wanazojaribu kuunda hushindwa kila wakati. Ishara ya onyo la mapema ni ukosefu wa uzoefu na lugha za kawaida za programu za tasnia na maktaba.

Lakini vipi kuhusu watu wanaounda mifumo inayoonekana kufanya kazi? Unajuaje ikiwa kitu cha kutiliwa shaka kinaendelea? Sheria hiyo hiyo inatumika! Charlatan ni mhusika mbaya ambaye anakuonyesha jinsi mtindo huo ulifanya kazi vizuri...kwenye data ile ile waliyotumia kuunda modeli.

Ikiwa umeunda mfumo changamano wa kujifunza wa mashine, unajuaje jinsi ulivyo mzuri? Hutajua hadi umwonyeshe akifanya kazi na data mpya ambayo hajawahi kuona.

Ulipoona data kabla ya kutabiri - kuna uwezekano kablakuwaambia

Unapokuwa na data ya kutosha kutenganisha, hauitaji kutaja uzuri wa fomula zako ili kuhalalisha mradi (tabia ya mtindo wa zamani ninayoiona kila mahali, sio tu katika sayansi). Unaweza kusema: "Najua inafanya kazi kwa sababu ninaweza kuchukua seti ya data ambayo sijaona hapo awali na kutabiri hasa kitakachotokea huko ... na nitakuwa sahihi. Tena na tena".

Kujaribu modeli/nadharia yako dhidi ya data mpya ndio msingi bora wa kujiamini.

Sivumilii walaghai wa data. Sijali kama maoni yako yanatokana na hila tofauti. Sijavutiwa na uzuri wa maelezo. Nionyeshe kwamba nadharia/mfano wako hufanya kazi (na unaendelea kufanya kazi) kwenye rundo zima la data mpya ambayo hujawahi kuona hapo awali. Huu ni mtihani halisi wa nguvu ya maoni yako.

Kuwasiliana na Wataalam wa Sayansi ya Data

Ikiwa unataka kuchukuliwa kwa uzito na kila mtu anayeelewa ucheshi huu, acha kujificha nyuma ya hesabu za dhana ili kuunga mkono upendeleo wa kibinafsi. Nionyeshe ulichonacho. Ikiwa unataka wale "wanaoipata" waone nadharia/modeli yako kama zaidi ya ushairi wa kutia moyo, uwe na ujasiri wa kuonyesha jinsi inavyofanya kazi vizuri kwenye seti mpya kabisa ya data... mbele ya mashahidi. !

Rufaa kwa viongozi

Kataa kuchukua kwa uzito "mawazo" yoyote kuhusu data hadi yajaribiwe ya mpya data. Je, hujisikii kuweka juhudi? Endelea na uchanganuzi, lakini usitegemee mawazo hayaβ€”hayanategemeki na hayajajaribiwa kutegemewa. Zaidi ya hayo, shirika linapokuwa na data kwa wingi, hakuna upande mwingine wa kufanya utengano kuwa msingi katika sayansi na kuudumisha katika kiwango cha miundombinu kwa kudhibiti ufikiaji wa data ya majaribio ya takwimu. Hii ni njia nzuri ya kukomesha watu wanaojaribu kukudanganya!

Ikiwa unataka kuona mifano zaidi ya walaghai bila faida yoyote - hapa kuna uzi mzuri kwenye Twitter.

Matokeo ya

Wakati kuna data ndogo sana ya kutenganisha, ni mdanganyifu pekee anayejaribu kufuata msukumo kwa makini kwa kugundua Amerika kwa kurudi nyuma, kugundua matukio ambayo tayari yanajulikana kuwa kwenye data, na kuita mshangao kuwa muhimu kitakwimu. Hii inawatofautisha na mchambuzi mwenye nia iliyo wazi, anayeshughulikia maongozi, na mwanatakwimu makini, ambaye hutoa ushahidi wakati wa kufanya utabiri.

Wakati kuna data nyingi, pata mazoea ya kutenganisha data ili uweze kuwa na ulimwengu bora zaidi! Hakikisha unafanya uchanganuzi na takwimu kando kwa vikundi vidogo vya rundo asili la data.

  • Wachambuzi kukupa msukumo na moyo wazi.
  • Takwimu kukupa majaribio makali.
  • Charlatans kukupa mtazamo uliopotoka ambao unajifanya kuwa uchanganuzi pamoja na takwimu.

Pengine, baada ya kusoma makala, utakuwa na mawazo "Je, mimi ni charlatan"? Hii ni sawa. Kuna njia mbili za kuondokana na wazo hili: kwanza, angalia nyuma, angalia kile umefanya, ikiwa kazi yako na data imeleta manufaa ya vitendo. Na pili, bado unaweza kufanyia kazi sifa zako (ambazo hakika hazitakuwa za kupita kiasi), hasa kwa vile tunawapa wanafunzi wetu ujuzi wa vitendo na ujuzi unaowaruhusu kuwa wanasayansi halisi wa data.

Jinsi ya kutambua charlatan kutoka Sayansi ya Data?

Kozi zaidi

Soma zaidi

Chanzo: mapenzi.com

Kuongeza maoni