Conas charlatan a aithint ó Eolaíocht Sonraí?

Conas charlatan a aithint ó Eolaíocht Sonraí?
B’fhéidir gur chuala tú trácht ar anailísithe, ar speisialtóirí foghlama meaisín agus intleachta saorga, ach ar chuala tú fúthu siúd a bhfuil ró-íocaíocht éagórach orthu? Buail sonraí charlatan! Tugann na hacks seo, a mheallann poist brabúsaí, droch-ainm d'eolaithe sonraí fíor. San ábhar tuigimid conas daoine den sórt sin a thabhairt chuig uisce glan.

Tá charlatans sonraí i ngach áit

Tá charlatans sonraí chomh maith sin ag dul i bhfolach i radharc soiléir gur féidir leat bheith ar cheann acugan fiú é a thuiscint. Seans go bhfuil d’eagraíocht ag cothú na ndaoine sneaky seo le blianta fada, ach is é an dea-scéal ná go bhfuil sé éasca iad a aithint má tá a fhios agat cad ba cheart duit a lorg.
Is é an chéad chomhartha rabhaidh ná easpa tuisceana sin is disciplíní an-difriúla iad anailísíocht agus staitisticí. Míneoidh mé é seo a thuilleadh.

Disciplíní éagsúla

Cuirtear oiliúint ar staitisteoirí chun conclúidí a dhéanamh faoi cad a théann níos faide ná a gcuid sonraí, cuirtear oiliúint ar anailísithe chun ábhar tacair sonraí a scrúdú. I bhfocail eile, tarraingíonn anailísithe conclúidí faoi cad atá ina gcuid sonraí, agus tarraingíonn staitisteoirí conclúidí faoi cad nach bhfuil sna sonraí. Cuidíonn anailísithe leat ceisteanna maithe a chur (hipitéisí a dhéanamh), agus cabhraíonn staitisteoirí leat freagraí maithe a fháil (tástáil ar do hipitéisí).

Tá róil aisteacha hibrideacha ann freisin ina ndéanann duine iarracht suí ar dhá chathaoir... Cén fáth nach bhfuil? Bunphrionsabal na heolaíochta sonraí: má tá tú ag déileáil le neamhchinnteacht, ní féidir leat é a úsáid mar an gcéanna pointe sonraí le haghaidh hipitéisí agus tástála. Nuair a bhíonn sonraí teoranta, cuireann éiginnteacht iallach ar rogha a dhéanamh idir staidreamh nó anailísíocht. Míniú anseo.

Gan staitisticí, beidh tú i bhfostú agus ní bheidh tú in ann a thuiscint cé acu an bhfuil an breithiúnas a rinne tú díreach tar éis seasamh suas, agus gan anailís, tá tú ag bogadh go dall, gan mórán seans agat an rud anaithnid a mhilleadh. Is rogha deacair é seo.

Is é bealach an charlatan amach as an praiseach seo ná neamhaird a dhéanamh air agus ligean air féin go bhfuil iontas air faoin rud a tharlaíonn go tobann. Tagann an loighic taobh thiar de thástáil hipitéisí staitistiúla síos don cheist an gcuireann na sonraí iontas orainn go leor chun ár n-intinn a athrú. Conas is féidir linn a bheith ionadh le sonraí má tá sé feicthe againn cheana féin?

Aon uair a fhaigheann charlatans patrún, faigheann siad spreagtha, ansin seiceáil sonraí céanna le haghaidh an patrún céanna, an toradh a fhoilsiú le p-luach dlisteanach nó dhó, in aice lena dteoiric. Mar sin, tá siad suite duit (agus, b'fhéidir, dóibh féin freisin). Is cuma leis an p-luach seo mura gcloíonn tú le do hipitéis до conas a d'fhéach tú ar do shonraí. Déanann Charlatans aithris ar ghníomhartha anailísithe agus staitisteoirí gan na cúiseanna a thuiscint. Mar thoradh air sin, faigheann réimse iomlán na heolaíochta sonraí droch-cháil.

Tarraingíonn staitisteoirí fíor a gcuid conclúidí féin i gcónaí

A bhuí le clú beagnach mystical na staitisteoirí as a réasúnaíocht dhian, tá an méid faisnéise bréige in Eolaíocht Sonraí níos airde riamh. Is furasta é a mheabhlaireacht agus gan a bheith gafa, go háirithe má cheapann an t-íospartach gan amhras gur cothromóidí agus sonraí atá i gceist. Is tacar sonraí é tacar sonraí, ceart? Níl. Tá sé tábhachtach conas a úsáideann tú é.

Ar ámharaí an tsaoil, níl ach leid amháin ag teastáil uait chun na charlatans a ghabháil: tá siad "ag fáil amach Meiriceá go haisghníomhach." Trí fheiniméin a bhfuil a fhios acu cheana féin sna sonraí a athaimsiú.

Murab ionann agus charlatans, tá dea-anailísithe meon oscailte agus tuigeann siad gur féidir go leor mínithe éagsúla a bheith ag smaointe spreagthacha. Ag an am céanna, déanann staitisteoirí maithe a gcuid conclúidí a shainiú go cúramach sula ndéanann siad iad.

Tá anailísithe díolmhaithe ó dhliteanas... chomh fada agus a fhanann siad laistigh de raon feidhme a gcuid sonraí. Má bhíonn cathú orthu rud éigin a éileamh nach bhfaca siad, sin post iomlán eile. Ba chóir dóibh bróga an anailísí a bhaint agus bróga an staitisteoir a chur air. Tar éis an tsaoil, is cuma cén teideal poist oifigiúil, níl aon riail ann a deir nach féidir leat staidéar a dhéanamh ar an dá ghairm más mian leat. Ní Just a dhéanamh amú orthu.

Díreach toisc go bhfuil tú go maith ag staitisticí, ní chiallaíonn sé sin go bhfuil tú go maith ag anailísíocht, agus vice versa. Má dhéanann duine iarracht a mhalairt a insint duit, ba chóir duit a bheith fainiciúil. Má insíonn an duine seo duit go bhfuil sé ceadaithe conclúidí staitistiúla a bhaint as sonraí a bhfuil staidéar déanta agat orthu cheana féin, is cúis é seo le bheith fainiciúil faoi dhó.

Mínithe aisteach

Agus tú ag breathnú ar charlatans sonraí san fhiántas, tabharfaidh tú faoi deara gur breá leo scéalta iontacha a chumadh chun na sonraí a bhreathnaíonn siad a “mhíniú”. An níos acadúla, is amhlaidh is fearr. Is cuma go bhfuil na scéalta seo in oiriúint de réir a chéile.

Nuair a dhéanann charlatans seo - lig dom a bheith soiléir - tá siad suite. Ní féidir le haon mhéid cothromóidí ná coincheapa bréige déanamh suas as an bhfíric gur thairg siad náid cruthúnas ar a gcuid teoiricí. Ná bíodh iontas ort faoi chomh neamhghnách agus atá a mínithe.

Tá sé seo mar an gcéanna le do chumais "síceacha" a léiriú trí bhreathnú ar na cártaí i do lámha ar dtús agus ansin a thuar cad atá agat ... cad atá agat. Is claonadh cúlfhéachana é seo, agus tá gairm na heolaíochta sonraí lán go barr leis.

Conas charlatan a aithint ó Eolaíocht Sonraí?

Deir anailísithe: "D'imigh tú díreach le Banríon na nDiamaint." Deir na staitisteoirí, “Scríobh mé síos mo hipitéisí ar an bpíosa páipéir seo sular thosaigh muid. Bímis ag súgradh thart agus ag féachaint ar roinnt sonraí agus féachaint an bhfuil an ceart agam." Deir Charlatans: “Bhí a fhios agam go raibh tú chun bheith i do Bhanríon na nDiamaint seo mar...”

Is é comhroinnt sonraí an réiteach tapa atá ag teastáil ó gach duine.

Nuair nach bhfuil mórán sonraí ann, caithfidh tú rogha a dhéanamh idir staitisticí agus anailísíocht, ach nuair a bhíonn níos mó ná go leor sonraí ann, tá deis iontach ann anailísíocht a úsáid gan mheabhlaireacht и staitisticí. Tá an chosaint foirfe agat i gcoinne charlatans - scaradh sonraí agus, i mo thuairim, is é seo an smaoineamh is cumhachtaí in Eolaíocht Sonraí.

Chun tú féin a chosaint ó charlatans, níl le déanamh agat ach a chinntiú go gcoimeádann tú roinnt sonraí tástála as a súile prying, agus ansin an chuid eile a chóireáil mar anailísíocht. Nuair a thagann tú trasna ar theoiric a bhfuil tú i mbaol glacadh léi, bain úsáid as chun an cás a mheas, agus ansin nocht do shonraí tástála rúnda chun a sheiceáil nach bhfuil an teoiric nonsense. Tá sé chomh simplí!

Conas charlatan a aithint ó Eolaíocht Sonraí?
Cinntigh nach bhfuil cead ag aon duine na sonraí tástála a fheiceáil le linn na céime taiscéalaíochta. Chun seo a dhéanamh, cloí le sonraí taighde. Níor cheart sonraí tástála a úsáid le haghaidh anailíse.

Is céim mhór chun cinn é seo ón méid a bhfuil taithí ag daoine air sa ré “sonraí beaga”, áit a gcaithfidh tú a mhíniú conas atá a fhios agat cad atá ar eolas agat chun a chur ina luí ar dhaoine ar deireadh go bhfuil rud éigin ar eolas agat.

Cuir na rialacha céanna i bhfeidhm ar ML/AI

Tá sé éasca freisin roinnt charlatan atá ag seasamh mar shaineolaithe ML/AI a fheiceáil. Gheobhaidh tú iad ar an mbealach céanna a bhfaighfeá drochinnealtóir ar bith eile: teipeann ar na "réitigh" a ndéanann siad iarracht iad a thógáil i gcónaí. Comhartha luathrabhaidh is ea easpa taithí le teangacha ríomhchláraithe caighdeánacha tionscail agus le leabharlanna.

Ach cad faoi na daoine a chruthaíonn córais a bhfuil an chuma orthu go n-oibríonn siad? Cén chaoi a bhfuil a fhios agat an bhfuil rud éigin amhrasach ar siúl? Tá feidhm ag an riail chéanna! Carachtar dochloíte é an Charlatan a thaispeánann duit cé chomh maith agus a d’oibrigh an tsamhail...ar na sonraí céanna a d’úsáid siad chun an tsamhail a chruthú.

Má tá córas meaisínfhoghlama insanely casta tógtha agat, cén chaoi a bhfuil a fhios agat cé chomh maith agus atá sé? Ní bheidh a fhios agat go dtí go dtaispeánfaidh tú di ag obair le sonraí nua nach bhfaca sí cheana.

Nuair a chonaic tú na sonraí roimh réamhaisnéis - ní dócha roimhag insint

Nuair a bhíonn do dhóthain sonraí agat le scaradh, ní gá duit áilleacht do fhoirmlí a lua leis an tionscadal a chosaint (nós seanfhaiseanta a fheicim i ngach áit, ní hamháin san eolaíocht). Is féidir leat a rá: “Tá a fhios agam go n-oibríonn sé mar is féidir liom tacar sonraí a ghlacadh nach bhfaca mé cheana agus a thuar go díreach cad a tharlóidh ansin ... agus beidh mé ceart. Arís agus arís eile".

Is é do mhúnla/teoiric a thástáil i gcoinne sonraí nua an bonn muiníne is fearr.

Ní féidir liom fhulaingt charlatans sonraí. Is cuma liom má tá do thuairim bunaithe ar chleasanna éagsúla. Níl áilleacht na mínithe tógtha agam. Taispeáin dom go n-oibríonn do theoiric/samhail (agus go leanann sé ar aghaidh ag obair) ar raon iomlán sonraí nua nach bhfaca tú riamh cheana. Is é seo an tástáil fíor ar an neart do thuairim.

Teagmháil a dhéanamh le Saineolaithe Eolaíochta Sonraí

Más mian leat a bheith dáiríre ag gach duine a thuigeann an greann seo, stop a chur i bhfolach taobh thiar de chothromóidí mhaisiúil chun tacú le laofachtaí pearsanta. Taispeáin dom a bhfuil agat. Más mian leat go mbreathnódh na daoine a “fhaigheann air” ar do theoiric/mhúnla mar níos mó ná filíocht inspioráideach amháin, bíodh an misneach agat seó iontach a chur ar siúl maidir le cé chomh maith agus a oibríonn sé ar thacar sonraí atá go hiomlán nua... os comhair na bhfinnéithe !

Achomharc chuig ceannairí

Diúltaigh aon "smaointe" faoi na sonraí a ghlacadh dáiríre go dtí go mbeidh tástáil déanta orthu nua sonraí. Nach mbraitheann tú mar iarracht a dhéanamh? Cloí leis an anailísíocht, ach ná bí ag brath ar na smaointe seo - tá siad neamhiontaofa agus ní dhearnadh tástáil iontaofachta orthu. Ina theannta sin, nuair a bhíonn flúirseach sonraí ag eagraíocht, níl aon bhuntáiste ag baint le deighilt a dhéanamh bunúsach san eolaíocht agus é a choinneáil ar leibhéal an bhonneagair trí rochtain ar shonraí tástála le haghaidh staidrimh a rialú. Is bealach iontach é seo chun stop a chur le daoine a bheith ag iarraidh amadán a thabhairt duit!

Más mian leat níos mó samplaí de charlatans a fheiceáil ní haon mhaith - seo snáithe iontach ar Twitter.

Torthaí

Nuair nach mbíonn an iomarca sonraí le scaradh, ní dhéanann ach charlatan iarracht an inspioráid a leanúint go docht trí Mheiriceá a fhionnadh go siarghabhálach, feiniméin a bhfuil aithne cheana féin orthu sna sonraí a athfhionnachtain go matamaiticiúil, agus glaoch ar an iontas suntasach go staitistiúil. Déanann sé seo idirdhealú idir iad agus an anailísí intinn oscailte, a dhéileálann le inspioráid, agus an staitisteoir mionchúiseach, a thairgeann fianaise agus tuar á dhéanamh.

Nuair a bhíonn go leor sonraí ann, cuir isteach ar an nós na sonraí a scaradh ionas go mbeidh an chuid is fearr den dá shaol agat! Bí cinnte anailísíocht agus staitisticí a dhéanamh ar leithligh le haghaidh fo-thacair aonair den bhuncharn sonraí.

  • Anailísithe inspioráid agus meon oscailte a thairiscint duit.
  • Staitisticí tástáil dhian a thairiscint duit.
  • Charlatans tairgeann tú léargas casta duit a ligeann ort gur anailísíocht móide staitisticí é.

B’fhéidir, tar éis duit an t-alt a léamh, go mbeidh an smaoineamh agat “an charlatan mé”? Tá sé seo go breá. Tá dhá bhealach ann chun fáil réidh leis an smaoineamh seo: ar dtús, breathnaigh siar, féach cad atá déanta agat, cibé an bhfuil tairbhe phraiticiúil ag baint le do chuid oibre le sonraí. Agus ar an dara dul síos, is féidir leat oibriú go fóill ar do cháilíochtaí (nach mbeidh iomarcach cinnte), go háirithe ós rud é go dtugaimid scileanna praiticiúla agus eolas dár gcuid mac léinn a ligeann dóibh a bheith ina n-eolaithe sonraí fíor.

Conas charlatan a aithint ó Eolaíocht Sonraí?

Tuilleadh cúrsaí

Leigh Nios mo

Foinse: will.com

Add a comment