Bii o ṣe le ṣe idanimọ charlatan lati Imọ-jinlẹ Data?

Bii o ṣe le ṣe idanimọ charlatan lati Imọ-jinlẹ Data?
O le ti gbọ ti awọn atunnkanwo, ẹkọ ẹrọ ati awọn alamọja oye itetisi atọwọda, ṣugbọn ṣe o ti gbọ ti awọn ti o san aibikita bi? Pade data charlatan! Awọn ẹlẹtan wọnyi, ti o fa nipasẹ awọn iṣẹ ti o ni ere, fun awọn onimọ-jinlẹ data gidi ni orukọ buburu. Ninu ohun elo a loye bi a ṣe le mu iru awọn eniyan bẹ lọ si omi mimọ.

Awọn Charlatans data wa nibi gbogbo

Awọn Charlatans data dara pupọ ni fifipamọ ni oju itele ti o le jẹ ọkan ninu wọnlaisi ani mọ. Awọn aye jẹ pe ajo rẹ ti n gbe awọn scammers wọnyi duro fun awọn ọdun, ṣugbọn iroyin ti o dara ni pe wọn rọrun lati ṣe idanimọ ti o ba mọ kini lati wa.
Ikilọ ami akọkọ ko ni oye kini atupale ati awọn iṣiro jẹ awọn ilana ti o yatọ pupọ. Emi yoo ṣe alaye siwaju sii.

Awọn ilana oriṣiriṣi

Awọn oniṣiro ti ni ikẹkọ lati fa awọn ipinnu nipa ohun ti o wa ni ita data wọn, awọn atunnkanka ti ni ikẹkọ lati ṣe iwadi akoonu ti ṣeto data kan. Ni awọn ọrọ miiran, awọn atunnkanka fa awọn ipinnu nipa ohun ti o wa ninu data wọn, ati awọn oniṣiro ṣe ipinnu nipa ohun ti ko si ninu data naa. Awọn atunnkanka ṣe iranlọwọ fun ọ lati beere awọn ibeere to dara (awọn amoro), ati awọn iṣiro ṣe iranlọwọ fun ọ lati ni awọn idahun to dara (awọn idawọle idanwo).

Nibẹ ni o wa tun burujai arabara ipa ibi ti a eniyan gbiyanju lati joko lori meji ijoko awọn ... Kilode ti ko? Ilana ipilẹ ti imọ-jinlẹ data: ti o ba n ṣe aidaniloju, maṣe lo ikan na aaye data fun awọn idawọle ati idanwo. Nigbati data ba ni opin, aidaniloju fi agbara mu ọkan lati yan laarin awọn iṣiro tabi awọn atupale. Alaye nibi.

Laisi awọn iṣiro, iwọ yoo di ati ki o ko ni anfani lati ni oye boya idajọ ti o ṣẹṣẹ gbekale duro si ibawi, ati laisi itupalẹ, o nlọ ni afọju, ni aye kekere ti taming aimọ. Eleyi jẹ a soro wun.

Ọna ti charlatan jade kuro ninu idarudapọ yii ni lati foju parẹ ati lẹhinna dibọn pe o ṣe iyalẹnu ohun ti o ṣafihan lojiji. Imọye ti o wa lẹhin idanwo awọn idawọle iṣiro ṣan silẹ lati beere boya data naa ṣe iyanilẹnu wa to lati yi ọkan wa pada. Bawo ni a ṣe le ṣe iyalẹnu nipasẹ data ti a ba ti rii tẹlẹ?

Nigbakugba ti awọn charlatans wa apẹrẹ kan wọn ṣe iwuri lẹhinna ṣe idanwo kanna data fun apẹrẹ kannalati fi esi naa ranṣẹ, pẹlu p-iye ti o tọ tabi meji, lẹgbẹẹ imọran wọn. Nipa ṣiṣe bẹ, wọn purọ fun ọ (ati o ṣee ṣe fun ara wọn paapaa). Yi p-iye ko ni pataki ti o ba ti o ko ba Stick si rẹ ilewq. si bi o ṣe wo data rẹ. Charlatans afarawe awọn sise ti atunnkanka ati statisticians lai agbọye awọn idi. Bi abajade, gbogbo aaye ti imọ-jinlẹ data n gba rap buburu kan.

Awọn oniṣiro otitọ nigbagbogbo fa awọn ipinnu tiwọn

Ṣeun si orukọ aramada ti o fẹrẹẹ jẹ ti awọn onimọ-iṣiro fun ironu lile, iye alaye iro ni Imọ-jinlẹ Data wa ni giga ni gbogbo igba. O rọrun lati ṣe iyanjẹ ati ki o ma ṣe mu, ni pataki ti olufaragba airotẹlẹ ba ro pe gbogbo rẹ jẹ nipa awọn idogba ati data. Iṣeduro data jẹ ipilẹ data, otun? Rara. O ṣe pataki bi o ṣe lo.

Ni Oriire, iwọ nikan nilo olobo kan lati mu awọn charlatans: wọn “ṣawari Amẹrika lẹhin otitọ.” Ṣiṣawari awọn iyalẹnu ti wọn ti mọ tẹlẹ wa ninu data naa.

Ko dabi awọn charlatans, awọn atunnkanka ti o dara jẹ ọkan-sisi ati loye pe awọn imọran iwuri le ni ọpọlọpọ awọn alaye oriṣiriṣi. Ni akoko kanna, awọn oniṣiro ti o dara ni iṣọra ṣalaye awọn ipinnu wọn ṣaaju ki wọn fa wọn.

Awọn atunnkanka jẹ alayokuro lati layabiliti… niwọn igba ti wọn ko ba kọja data wọn. Ti wọn ba ni idanwo lati beere nkan ti wọn ko tii rii, iyẹn jẹ iṣẹ ti o yatọ. Wọn yẹ ki o "yọ bata wọn" gẹgẹbi oluyanju ati "yi pada si" bata ti oniṣiro. Lẹhinna, ohunkohun ti akọle iṣẹ osise, ko si ofin ti o sọ pe o ko le ṣe iwadi awọn iṣowo mejeeji ti o ba fẹ. O kan maṣe da wọn lẹnu.

Nitoripe o dara ni awọn iṣiro ko tumọ si pe o dara ni awọn atupale, ati ni idakeji. Ti ẹnikan ba n gbiyanju lati sọ fun ọ bibẹẹkọ, o yẹ ki o wa ni iṣọ rẹ. Ti eniyan yii ba sọ fun ọ pe o gba ọ laaye lati fa itọka iṣiro kan lori data ti o ti kẹkọọ tẹlẹ, eyi jẹ idi kan lati ṣọra ni ilọpo meji.

Awọn alaye ti o burujai

Nigbati o ba ṣe akiyesi awọn charlatans data ninu egan, iwọ yoo ṣe akiyesi pe wọn nifẹ lati ṣe awọn itan irokuro lati “ṣalaye” data akiyesi. Awọn diẹ omowe awọn dara. Ko ṣe pataki pe awọn itan wọnyi ti wa ni ṣiṣiṣẹ sẹhin.

Nigbati awọn charlatans ṣe eyi - jẹ ki n ṣe itọrẹ pẹlu awọn ọrọ - irọ ni wọn ṣe. Ko si iye awọn idogba tabi awọn imọran lẹwa ti o ṣe fun otitọ pe wọn funni ni ẹri odo ti awọn ẹya wọn. Má ṣe yà ọ́ lẹ́nu bí àwọn àlàyé wọn ṣe ṣàjèjì tó.

Eyi jẹ kanna bii iṣafihan awọn agbara “ariran” rẹ nipa wiwo akọkọ awọn kaadi ti o wa ni ọwọ rẹ, ati lẹhinna sọ asọtẹlẹ ohun ti o mu… ohun ti o mu. Eyi jẹ ojuṣaaju ẹhin, ati pe oojọ onimọ-jinlẹ data ti kun pẹlu rẹ.

Bii o ṣe le ṣe idanimọ charlatan lati Imọ-jinlẹ Data?

Awọn atunnkanka sọ pe: "O kan lọ pẹlu ayaba ti awọn okuta iyebiye." Àwọn oníṣirò sọ pé, “Mo kọ àwọn àbá èrò orí mi sórí bébà yìí kí a tó bẹ̀rẹ̀. Jẹ ki a ṣere, wo diẹ ninu data ki o rii boya Mo tọ.” Awọn charlatans sọ pe, "Mo mọ pe iwọ yoo jẹ ayaba ti awọn okuta iyebiye nitori..."

Pipin data jẹ atunṣe iyara ti gbogbo eniyan nilo.

Nigbati ko ba si data pupọ, o ni lati yan laarin awọn iṣiro ati awọn atupale, ṣugbọn nigbati data ba wa ju to, aye nla wa lati lo awọn itupalẹ laisi iyanjẹ. и awọn iṣiro. O ni aabo pipe si awọn charlatans - eyi ni iyapa data ati, ninu ero mi, eyi ni imọran ti o lagbara julọ ni Imọ-jinlẹ Data.

Lati daabobo ararẹ lọwọ awọn charlatans, gbogbo ohun ti o ni lati ṣe ni rii daju pe o tọju data idanwo diẹ ninu awọn oju prying wọn lẹhinna tọju ohun gbogbo miiran bi awọn atupale. Nigbati o ba pade ilana kan ti o ni ewu gbigba, lo lati ṣe ayẹwo ipo naa lẹhinna ṣafihan data idanwo aṣiri rẹ lati rii daju pe ero naa kii ṣe isọkusọ. O rọrun pupọ!

Bii o ṣe le ṣe idanimọ charlatan lati Imọ-jinlẹ Data?
Rii daju pe ko si ẹnikan ti o gba laaye lati wo data idanwo lakoko ipele iṣawari. Lati ṣe eyi, duro si data iwadi. Awọn data idanwo ko yẹ ki o lo fun itupalẹ.

Eleyi jẹ ńlá kan igbese soke lati ohun ti eniyan ti wa ni lo lati ni awọn akoko ti "kekere data", ibi ti o ni lati se alaye bi o ti mọ ohun ti o mọ ni ibere lati nipari parowa fun awon eniyan ti o gan mọ nkankan.

Lilo awọn ofin kanna si ML/AI

Diẹ ninu awọn charlatans ti o farahan bi awọn amoye ML/AI tun rọrun lati rii. Iwọ yoo mu wọn ni ọna kanna ti iwọ yoo mu eyikeyi ẹlẹrọ buburu miiran: “awọn ojutu” ti wọn gbiyanju lati kọ nigbagbogbo kuna. Ami ikilọ ni kutukutu jẹ aini iriri pẹlu awọn ede boṣewa ile-iṣẹ ati awọn ile ikawe siseto.

Ṣugbọn kini nipa awọn eto ṣiṣe awọn eniyan ti o dabi pe o ṣiṣẹ? Bawo ni o ṣe mọ boya nkan ifura n ṣẹlẹ? Ofin kanna kan! Charlatan jẹ iwa buburu ti o fihan ọ bi awoṣe ṣe ṣe daradara… lori data kanna ti wọn lo lati ṣẹda awoṣe naa.

Ti o ba ti kọ eto ẹkọ ẹrọ ti o ni idiju, bawo ni o ṣe mọ bi o ṣe dara to? Iwọ kii yoo mọ titi ti o fi fihan pe o n ṣiṣẹ pẹlu data tuntun ti ko rii tẹlẹ.

Nigbati o ba rii data ṣaaju asọtẹlẹ, ko ṣeeṣe pe niwaju tiwipe.

Nigbati o ba ni data ti o to lati pin, iwọ ko nilo lati pe ẹwa ti awọn agbekalẹ rẹ lati ṣe idalare iṣẹ akanṣe kan (iwa aṣa atijọ ti Mo rii nibi gbogbo, kii ṣe ni imọ-jinlẹ nikan). O le sọ: “Mo mọ pe o ṣiṣẹ nitori pe MO le mu eto data ti Emi ko rii tẹlẹ ati sọ asọtẹlẹ pato ohun ti yoo ṣẹlẹ nibẹ… ati pe Emi yoo tọ. Lẹẹkansi ati lẹẹkansi".

Idanwo awoṣe / imọ-ẹrọ rẹ lodi si data tuntun jẹ ipilẹ ti o dara julọ fun igbẹkẹle.

Emi ko fi aaye gba charlatans data. Emi ko bikita ti o ba ti rẹ ero wa ni da lori orisirisi awọn eerun. Ẹwa ti awọn alaye ko wú mi loju. Fihan mi pe ero/awoṣe rẹ n ṣiṣẹ (ati tẹsiwaju lati ṣiṣẹ) lori ọpọlọpọ data tuntun ti o ko rii tẹlẹ. Eyi ni idanwo gidi ti agbara ti ero rẹ.

Kan si Data Sayensi

Ti o ba fẹ ki o mu ni pataki nipasẹ ẹnikẹni ti o loye awada yii, dawọ farapamọ lẹhin awọn idogba ti o wuyi lati jẹ ki ojuṣaaju ti ara ẹni wa laaye. Ṣe afihan ohun ti o ni. Ti o ba fẹ ki awọn ti o “gba” lati rii imọran / awoṣe rẹ bi diẹ sii ju awọn ewi iwunilori lọ, ni igboya lati fi ifihan nla kan han bi o ṣe n ṣiṣẹ daradara lori ṣeto data tuntun tuntun… ni iwaju awọn ẹlẹri!

Rawọ si awọn olori

Kọ lati mu eyikeyi "awọn imọran" nipa data ni pataki titi ti o fi jẹ idanwo lodi si tuntun data. Ṣe o ko fẹ lati fi sinu akitiyan? Stick si awọn atupale, ṣugbọn maṣe gbẹkẹle awọn imọran wọnyi - wọn ko ni igbẹkẹle ati pe wọn ko ti ni idanwo fun igbẹkẹle. Paapaa, nigbati agbari kan ba ni data lọpọlọpọ, ko si isalẹ si ṣiṣe ipinya ipilẹ ti imọ-jinlẹ ati mimu rẹ ni ipele amayederun nipa ṣiṣakoso iraye si data idanwo fun awọn iṣiro. Eyi jẹ ọna nla lati da awọn igbiyanju lati tàn ọ jẹ!

Ti o ba fẹ wo awọn apẹẹrẹ diẹ sii ti awọn charlatans ti n gbero nkan buburu - Eyi jẹ okun twitter nla kan.

Awọn esi

Nigbati data naa ba kere pupọ lati yapa, charlatan nikan ni o gbidanwo lati tẹle awokose ni muna, ṣe awari Amẹrika ni ifẹhinti lẹnu iṣẹ, mathematiki ṣe awari awọn iyalẹnu ti a ti mọ tẹlẹ lati wa ninu data naa, ati pipe iyalẹnu ni iṣiro pataki. Eyi ṣe iyatọ wọn si oluyanju oninu-ọna ti o n ṣe pẹlu awokose ati oniṣiro iṣiro ti o funni ni ẹri nigbati asọtẹlẹ.

Nigbati ọpọlọpọ data ba wa, wọle sinu iwa ti pinpin data ki o le ni ohun ti o dara julọ ti awọn agbaye mejeeji! Rii daju lati ṣe awọn atupale ati awọn iṣiro lọtọ fun awọn ipin lọtọ ti opoplopo data atilẹba.

  • Awọn atunyẹwo nse o awokose ati irisi.
  • Awọn iṣiro fun ọ ni idanwo lile.
  • Charlatans fun ọ ni iwoye oniyi ti o ṣe bi ẹni pe o jẹ atupale pẹlu awọn iṣiro.

Bóyá, lẹ́yìn tí o bá ti ka àpilẹ̀kọ náà, ìwọ yóò ní èrò náà “Ṣé charlatan ni mí bí”? Eyi dara. Awọn ọna meji lo wa lati yọkuro ero yii: akọkọ, wo pada, wo ohun ti o ti ṣe, boya iṣẹ rẹ pẹlu data ti mu awọn anfani to wulo. Ati ni ẹẹkeji, o tun le ṣiṣẹ lori awọn afijẹẹri rẹ (eyiti dajudaju kii yoo jẹ superfluous), ni pataki niwọn bi a ti fun awọn ọmọ ile-iwe wa awọn ọgbọn iṣe ati imọ ti o gba wọn laaye lati di awọn onimọ-jinlẹ data gidi.

Bii o ṣe le ṣe idanimọ charlatan lati Imọ-jinlẹ Data?

Awọn iṣẹ ikẹkọ diẹ sii

Ka siwaju

orisun: www.habr.com

Fi ọrọìwòye kun