Rreth çuditshmërive të habrostatistikës

Unë kam vënë re sjellje të çuditshme në vlerësime më parë, por kohët e fundit çuditshmëria është bërë shumë e dukshme. Dhe vendosa ta hetoj problemin duke përdorur metodat shkencore që kam në dispozicion, domethënë: të analizoj dinamikën e plus-minus. E imagjinuat papritur?

Unë jam ende një programues, por mund të bëj gjëra shumë elementare. Kështu që unë kodova një mjet të thjeshtë që mbledh statistika nga panelet e postimit të Khabrov: të mirat, të këqijat, pamjet, faqeshënuesit, etj.

Rreth çuditshmërive të habrostatistikës

Statistikat shfaqen në grafik, pas studimit të të cilëve kemi mundur të zbulojmë disa surpriza të tjera, më të vogla. Por gjërat e para së pari.

Çudi 1.
Këtu filloi në të vërtetë kërkimi im statistikor.

Më dukej e çuditshme që në orët e para pas publikimit të disa postimeve të mia ato shkuan ashpër negativisht, më pas shkuan në zero dhe përfundimisht fituan plusin e pritur. Pse ndodhi?

Sapo isha gati të publikoja një postim tjetër - në dy pjesë. Vendosa t'i nënshtroj analizave statistikore.

Publikuar pjesën e parë. Në të njëjtën kohë, nisa programin dhe fillova të pres rezultatin. Fatkeqësisht, gjatë natës - ndërsa isha duke fjetur - programi ndaloi mbledhjen e informacionit për shkak të një defekti. Të nesërmen në mëngjes korrigjova gabimin, por statistikat rezultuan të ishin për më pak se një ditë. Megjithatë, tendencat janë të dukshme edhe për kohën e punuar.

Të dhënat jepen për 14 orët e para nga momenti i publikimit, intervali ndërmjet matjeve është 10 minuta.

Rreth çuditshmërive të habrostatistikës

Sytë nuk na mashtruan: shumica e minuseve ndodhin në orën e parë të ekzistencës së postimit. Në fillim postimi shkoi në territor negativ, më pas u rikuperua. Këtu janë numrat e përdorur për të hartuar grafikun:

Rreth çuditshmërive të habrostatistikës

Dhe kjo pavarësisht se shikimet po rriten pa probleme!

Rreth çuditshmërive të habrostatistikës

Hapat që fillojnë nga vlerat e mijëta shpjegohen me faktin se shkurtesat fillojnë në panelin Khabrov: nuk ka askund për të marrë numrin e saktë të shikimeve (ndoshta mund të ishte marrë nga shërbimet e palëve të treta, por unë nuk i përdora ato ).

Unë nuk jam ekspert në statistika, por një shpërndarje e tillë e minuseve është jonormale, me sa kuptoj unë?!

Shikoni, faqerojtësit shpërndahen pak a shumë në mënyrë të barabartë gjatë periudhës së regjistrimit:

Rreth çuditshmërive të habrostatistikës

Komentet gjithashtu shpërndahen në mënyrë të barabartë:

Rreth çuditshmërive të habrostatistikës

Ka shpërthime aktiviteti dhe pasiviteti, por ato shpërndahen gjithashtu gjatë periudhës: komentimi ose zbehet ose rifillon.

E njëjta gjë me abonentët - ka një rritje të lehtë uniforme:

Rreth çuditshmërive të habrostatistikës

Karma nuk ndryshoi gjatë periudhës së raportimit - nuk po e citoj atë. Dhe vlerësimi është llogaritur nga Habr, nuk ka kuptim ta renditim atë.

Të gjithë treguesit ndryshojnë në përpjesëtim me numrin e shikimeve, dhe vetëm me minuset diçka nuk shkon: shpërthimi i zemërimit ndodh në orën e parë nga fillimi i botimit. E njëjta gjë ndodhi me postimet e mia të mëparshme. Por nëse më parë këto ishin, si të thuash, përshtypje personale, tani ato konfirmohen me regjistrim.

Sipas mendimit tim thjesht noob, një shpërndarje e tillë do të thotë: ka disa përdorues në sit që shikojnë me qëllim postimet e fundit të publikuara dhe votojnë kundër disa prej postimeve - bazuar në një nevojë të njohur vetëm për ta. Unë shkruaj "disa nga postimet" sepse e vura re këtë efekt jo vetëm në publikimet e mia. Në të gjitha rastet, efekti është i theksuar, përndryshe thjesht nuk do t'i kisha kushtuar vëmendje.

Unë kam katër versione se pse ndodh kjo.

Versioni 1. Perversion mendor. Njerëzit e sëmurë vëzhgojnë qëllimisht autorët që u duken të pakëndshëm dhe i votojnë kundër, me qëllim që t'i dëmtojnë ata.

Unë nuk besoj në këtë version.

Versioni 2. Efekti psikologjik. Cilin - nuk e di. Epo, pse lexuesit së pari e minojnë njëzëri postimin, pastaj jo më pak unanimisht e votojnë atë? A janë minus si jotematike, por plus pasi njohësit e bukurisë e gjejnë veten në shumicë? Nuk e di.

Nëse ka psikologë mes lexuesve, le të thonë fjalën e tyre.

Versioni 3. Shërbëtorët po veprojnë. Pse duhet që shefat e tyre të përhapin kalbësi në postet e Khabrov? Zoti e di. Megjithatë, ushtarakë nuk ka vetëm në vendin tonë. Kush do t'i kuptojë ata, Rusofobët?!

Versioni 4. Efektet e kombinuara të faktorëve të përmendur më parë.

Krejt e imagjinueshme.

Sido që të jetë, minusuesit arrijnë të zvogëlojnë numrin e shikimeve. Unë nuk jam i njohur me rregullat për sjelljen e postimeve të Khabrov në krye, as nuk e di nëse këto algoritme janë bërë publike apo jo, por është e qartë për mua: minusi i hershëm nuk lejon që postimet e izoluara të arrijnë në krye - më saktë, vonon arritjen, gjë që nga ana tjetër, në mënyrë të konsiderueshme, herë pas here zvogëlon numrin e shikimeve.

Me sa kuptoj unë, nuk ka mënyra efektive për të luftuar këtë të keqe. E vetmja mënyrë është votimi personal. Vetëm në këtë rast mund të përcaktoni se cilat profile janë duke ndjekur periodikisht dhe minus postimet e fundit. Megjithatë, nuk ka votim personal për Habré (ose më mirë, nuk bëhet publik).

Por jo gjithçka është kaq e thjeshtë.

Siç thashë, materiali i zbërthyer u botua pjesë-pjesë. Pas publikimit të pjesës së dytë, prisja një pamje të ngjashme: me daljen fillestare në minus dhe atë pasuese në plus. Sidoqoftë, efekti doli të ishte shumë më i zbutur: postimi nuk u shndërrua në minus.

Në kohën kur u publikua pjesa e dytë, defekti ishte rregulluar, kështu që të dhënat jepen në ditë:

Rreth çuditshmërive të habrostatistikës

Nuk e di nga erdhi zbutja. Ndoshta sepse u publikua të shtunën (votat kundër të shtunave nuk funksionojnë?) ose sepse ky është fundi i materialit të botuar më parë.

Sidoqoftë, shpërndarja e minuseve është ende e pabarabartë: të gjitha minuset ndodhin në gjysmën e parë të periudhës së regjistrimit, dhe minus përfundon shumë më herët se plus. Në të njëjtën kohë, pamjet shpërndahen gjatë periudhës saktësisht si herën e fundit - në mënyrë të barabartë:

Rreth çuditshmërive të habrostatistikës

Goditja e ndodhur rreth tre pasdite nuk është material i klasifikuar. Interneti im doli vetëm për një orë. Shërbimi nuk mund të lidhej me sitin.

Rreth çuditshmërive të habrostatistikës

Çdo gjë tjetër është plotësisht standarde.

Faqeshënuesit:

Rreth çuditshmërive të habrostatistikës

Komentet: si herën e kaluar, periudhat e aktivitetit alternohen me periudha heshtjeje.

Rreth çuditshmërive të habrostatistikës

Karma. U regjistrua një rritje prej disa njësive - natyrisht, jo e njëkohshme:

Rreth çuditshmërive të habrostatistikës

Dhe abonentë. Numri i përgjithshëm mbeti i pandryshuar (me sa duket, të interesuarit u regjistruan kur u publikua pjesa e parë). Vetëm rreth orës një pasdite pati një luhatje të vetme: dikush u çabonua - ndoshta gabimisht - por menjëherë u regjistrua përsëri. Nëse ishte një person tjetër, ndodhte kompensimi: numri i përgjithshëm i pajtimtarëve nuk ndryshoi.

Rreth çuditshmërive të habrostatistikës

Pra, metrikat e postimit sillen në një mënyrë të qartë dhe të parashikueshme. Të gjithë treguesit, përveç minuseve. Meqenëse nuk shoh ndonjë arsye të qartë për këtë, më duket kulmi minus të paktën i çuditshëm.

Çudi 2.
Ndonjëherë numri i shikimeve zvogëlohet (gjë që, natyrisht, është e pamundur), por së shpejti kthehet në normalitet.

E kam gjurmuar rastësisht, gjatë korrigjimit të programit, kur funksioni eksport-import ende nuk ishte bashkangjitur, kështu që në grafik mungon zigzagu përkatës. Mund ta pranoni fjalën time - ky efekt u vu re dy herë. Disa mijëra shikime, papritmas numri i shikimeve zvogëlohet me disa qindra, pas 10-20 minutash rikthehet në nivelin e mëparshëm (pa marrë parasysh rritjen natyrore).

Kjo është mjaft e thjeshtë: një gabim në sit. Dhe nuk ka asgjë për të menduar.

Çudi 3.
Kjo është ajo që më dukej shumë më e çuditshme sesa efektet e para vullnetare dhe të dyta teknike. Pluset nuk ndodhin të vetme, me një shpërndarje uniforme gjatë periudhës, por në blloqe. Por shtimi nuk është koment, kur një pyetje natyrshëm pasohet nga një përgjigje, ato janë një akt individual!

Shikoni më nga afër grafikët e rezultateve të publikuara më sipër: blloqet janë të dukshme.

Njerëz të ditur më tundën me kokë për shpërndarjen e Poisson, por unë nuk jam në gjendje ta llogaris vetë probabilitetin. Nëse jeni në gjendje, bëni llogaritë. Tashmë është e qartë për mua që numri i pluseve të dyfishta e tejkalon shumë normën.

Këtu janë të dhënat dixhitale mbi avantazhet e pjesës së parë të postimit. Grafiku tregon numrin e pluseve për pozicionet e vetme, të dyfishta dhe të trefishta në numrin total të vlerësimeve të dhëna. Siç u përmend më herët, intervali i matjes është 10 minuta.

Rreth çuditshmërive të habrostatistikës

Nga 30 goditje në 84 qeliza, dy qeliza u goditën tre herë. Epo, nuk e di se sa kjo korrespondon me teorinë e probabilitetit ...

Të dhënat për pjesën e dytë të postimit (meqenëse periudha e matjes është më e gjatë, po e shkurtoj sipas kohëzgjatjes së pjesës së parë, për krahasueshmëri):

Rreth çuditshmërive të habrostatistikës

Nga rruga, këtu një nga pluset e vetme është ngjitur në kohë me atë të trefishuar, domethënë, në rreth 20 minuta pati një rritje të pluseve (29% e numrit të tyre të përgjithshëm ishin pluse). Dhe kjo nuk ndodhi në minutat e para të publikimit.

Marrëdhënia midis pozicioneve të vetme, të dyfishta dhe të trefishta është afërsisht e njëjtë si në pjesën e parë. Dhe rënia e përqindjes së vlerësimeve në matje shpjegohet me faktin se vlerësimet jepeshin më rrallë. U bënë matje, por nuk u regjistruan asnjë avantazh.

Unë nuk mund ta shpjegoj këtë efekt bllok plus në asnjë mënyrë, domethënë aspak. Për të këqijat, një sjellje e tillë "bllokuese" nuk duket të jetë tipike.

A dërgojnë emetuesit e mirësisë sugjerime në grupe, duke u ndezur dhe fikur? Hehehehe...

PS
Nëse dikush dëshiron të analizojë statistikat e postimeve duke përdorur metoda më të avancuara ose të kontrollojë aritmetikën, skedarët me të dhënat burimore janë këtu:
yadi.sk/d/iN4SL6tzsGEQxw

Unë nuk insistoj në dyshimet e mia - ndoshta e kam gabim, veçanërisht pasi statistikat janë të zymta. Shpresoj që komentet e statisticienëve profesionistë, psikologëve dhe përdoruesve të tjerë të interesuar të sqarojnë konfuzionin që ka lindur.

Faleminderit për vëmendjen tuaj.

Burimi: www.habr.com

Shto një koment