Oor die eienaardighede van habrostatistiek

Ek het al voorheen vreemde gedrag in graderings opgemerk, maar onlangs het die vreemdheid te duidelik geword. En ek het besluit om die probleem te ondersoek met behulp van die wetenskaplike metodes wat tot my beskikking is, naamlik: om die dinamika van plus-minus te ontleed. Het jy jou skielik verbeel?

Ek is steeds 'n programmeerder, maar ek kan baie basiese dinge doen. So ek het 'n eenvoudige hulpmiddel gekodeer wat statistieke van die panele van die Khabrov-pos versamel: voordele, nadele, sienings, boekmerke, ens.

Oor die eienaardighede van habrostatistiek

Die statistieke word in grafieke vertoon, na bestudering wat ons nog 'n paar verrassings, kleineres, kon ontdek. Maar eerste dinge eerste.

Vreemdheid 1.
Dit is waar my statistiese navorsing eintlik begin het.

Dit het vir my vreemd voorgekom dat hulle in die eerste ure na die publikasie van sommige van my plasings skerp negatief geword het, toe na nul gegaan het en uiteindelik die verwagte plus verdien het. Hoekom het dit gebeur?

Ek was net op die punt om nog 'n plasing te publiseer - in twee dele. Ek het besluit om hom aan statistiese ontleding te onderwerp.

Het die eerste deel gepubliseer. Terselfdertyd het ek die hulpprogram begin en begin wag vir die resultaat. Ongelukkig het die program snags – terwyl ek geslaap het – opgehou om inligting in te samel weens 'n fout. Die volgende oggend het ek die fout reggestel, maar die statistieke het geblyk vir minder as 'n dag te wees. Die neigings is egter ook duidelik vir die tyd gewerk.

Die data word verskaf vir die eerste 14 uur vanaf die oomblik van publikasie, die interval tussen metings is 10 minute.

Oor die eienaardighede van habrostatistiek

Die oë het ons nie bedrieg nie: die meeste van die minusse kom in die eerste uur van die pos se bestaan ​​voor. Eers het die pos in negatiewe terrein gegaan, toe het dit herstel. Hier is die getalle wat gebruik word om die grafiek te teken:

Oor die eienaardighede van habrostatistiek

En dit ten spyte van die feit dat uitsigte seepglad toeneem!

Oor die eienaardighede van habrostatistiek

Die stappe vanaf duisendste waardes word verduidelik deur die feit dat afkortings in die Khabrov-paneel begin: daar is nêrens om die presiese aantal kyke te kry nie (waarskynlik kon dit van derdeparty-dienste geneem gewees het, maar ek het dit nie gebruik nie ).

Ek is nie 'n kenner van statistiek nie, maar so 'n verspreiding van minusse is abnormaal, sover ek verstaan?!

Kyk, die boekmerke word min of meer eweredig oor die registrasietydperk versprei:

Oor die eienaardighede van habrostatistiek

Opmerkings word ook eweredig versprei:

Oor die eienaardighede van habrostatistiek

Daar is uitbarstings van aktiwiteit en passiwiteit, maar dit word ook oor die tydperk versprei: kommentaar vervaag of hervat.

Dieselfde met intekenare - daar is 'n eenvormige effense toename:

Oor die eienaardighede van habrostatistiek

Karma het nie gedurende die verslagtydperk verander nie - ek haal dit nie aan nie. En die gradering word deur Habr bereken, daar is geen sin om dit te lys nie.

Alle aanwysers verander in verhouding tot die aantal kyke, en slegs met die minusse is iets verkeerd: die woede-uitbarsting vind plaas in die eerste uur vanaf die begin van publikasie. Dieselfde het gebeur met my vorige plasings. Maar as dit vroeër so te sê persoonlike indrukke was, word dit nou deur registrasie bevestig.

Na my suiwer noob-opinie beteken so 'n verspreiding: daar is verskeie gebruikers op die webwerf wat doelbewus die nuutste gepubliseerde plasings bekyk en sommige van die plasings afstem - op grond van 'n behoefte wat net aan hulle bekend is. Ek skryf "sommige van die plasings" omdat ek hierdie effek nie net in my publikasies opgemerk het nie. In alle gevalle word die effek uitgespreek, anders sou ek eenvoudig nie aandag daaraan gegee het nie.

Ek het vier weergawes van hoekom dit gebeur.

Weergawe 1. Geestelike perversie. Siek mense waak doelbewus oor skrywers wat hulle onaangenaam vind en stem hulle af, met die doel om hulle skade aan te doen.

Ek glo nie in hierdie weergawe nie.

Weergawe 2. Sielkundige effek. Watter een - ek weet nie. Wel, hoekom minus lesers eers die plasing eenparig, en stem dit dan nie minder eenparig op nie? Is hulle min as nie-tematiese, maar plus na fynproewers van skoonheid bevind hulle in die meerderheid? Ek weet nie.

As daar sielkundiges onder die lesers is, laat hulle hul sê.

Weergawe 3. Die bediendes tree op. Waarom moet hul base vrot op Khabrov se poste versprei, weet God? Daar is egter dienspligtiges nie net in ons land nie. Wie sal hulle verstaan, Russophobes?!

Weergawe 4. Gekombineerde effekte van die voorheen genoemde faktore.

Heel denkbaar.

Hoe dit ook al sy, minusers kry dit reg om die aantal kyke te verminder. Ek is nie vertroud met die reëls om Khabrov se plasings na bo te bring nie, ek weet nie eens of hierdie algoritmes openbaar gemaak is of nie, maar dit is vir my duidelik: vroeë minus laat nie toe dat uitgestote plasings die top bereik nie - meer presies, dit vertraag om daar te kom, wat op sy beurt weer die aantal kyke aansienlik verminder.

Sover ek verstaan, is daar geen effektiewe maniere om hierdie euwel te bekamp nie. Die enigste manier is persoonlike stemming. Slegs in hierdie geval kan jy vasstel watter profiele periodiek dopgehou word en minus jongste plasings. Daar is egter geen persoonlike stemming oor Habré nie (of eerder, dit word nie openbaar gemaak nie).

Maar dit is nie so eenvoudig nie.

Soos ek gesê het, is die ontleed materiaal in dele gepubliseer. Na die publikasie van die tweede deel het ek 'n soortgelyke prentjie verwag: met die aanvanklike uitset in die minus en die daaropvolgende een in die plus. Die effek blyk egter baie meer glad te wees: die pos het nie in 'n minus verander nie.

Teen die tyd dat die tweede deel gepubliseer is, was die fout reggestel, so die data word per dag gegee:

Oor die eienaardighede van habrostatistiek

Ek weet nie waar die gladmaak vandaan gekom het nie. Miskien omdat dit Saterdag gepubliseer is (afstemme werk nie op Saterdae nie?) of omdat dit die einde is van voorheen gepubliseerde materiaal.

Die verdeling van minusse is egter steeds ongelyk: alle minusse kom in die eerste helfte van die registrasieperiode voor, en minusse eindig baie vroeër as plus. Terselfdertyd word aansigte presies soos die vorige keer oor die tydperk versprei - eweredig:

Oor die eienaardighede van habrostatistiek

Die styging wat omstreeks drie-uur die middag gebeur het, is nie geklassifiseerde materiaal nie. My internet het net vir 'n uur uitgegaan. Die hulpprogram kon nie aan die werf koppel nie.

Oor die eienaardighede van habrostatistiek

Al die ander is heeltemal standaard.

Boekmerke:

Oor die eienaardighede van habrostatistiek

Opmerkings: soos die vorige keer, word periodes van aktiwiteit afgewissel met periodes van stilte.

Oor die eienaardighede van habrostatistiek

Karma. 'n Toename van 'n paar eenhede is aangeteken - natuurlik nie gelyktydig nie:

Oor die eienaardighede van habrostatistiek

En intekenare. Die totale getal het onveranderd gebly (blykbaar het belangstellendes ingeskryf toe die eerste deel gepubliseer is). Net so omstreeks eenuur die middag was daar ’n enkele skommeling: iemand het – dalk per ongeluk – uitgeteken, maar dadelik weer ingeteken. As dit 'n ander persoon was, het vergoeding plaasgevind: die totale aantal intekenare het nie verander nie.

Oor die eienaardighede van habrostatistiek

Dus, post-metrieke tree op 'n duidelike en voorspelbare manier op. Alle aanwysers, behalwe vir die minusse. Aangesien ek geen ooglopende rede hiervoor sien nie, vind ek die minuspiek ten minste vreemd.

Vreemdheid 2.
Soms neem die aantal kyke af (wat natuurlik onmoontlik is), maar keer gou terug na normaal.

Ek het dit per ongeluk opgespoor, terwyl ek die program ontfout het, toe die uitvoer-invoer-funksie nog nie aangeheg was nie, so die ooreenstemmende sigsag ontbreek op die grafiek. Jy kan my woord daarvoor vat – hierdie effek is twee keer waargeneem. 'n Paar duisend kyke, skielik neem die aantal kyke met 'n paar honderd af, na 10-20 minute word dit herstel na sy vorige vlak (sonder om die natuurlike toename in ag te neem).

Dit is redelik eenvoudig: 'n fout op die webwerf. En daar is niks om oor na te dink nie.

Vreemdheid 3.
Dit is wat vir my baie vreemder gelyk het as die vrywillige eerste en tegniese tweede effekte. Pluspunte gebeur nie alleen, met 'n eenvormige verspreiding oor die tydperk nie, maar in blokke. Maar byvoeging is nie 'n opmerking nie, wanneer 'n vraag natuurlik gevolg word deur 'n antwoord, is dit 'n individuele handeling!

Kyk van nader na die resultaatgrafieke wat hierbo gepubliseer is: die blokke is opvallend.

Kundige mense het vir my geknik oor die Poisson-verspreiding, maar ek is nie in staat om die waarskynlikheid op my eie te bereken nie. As jy in staat is, doen die wiskunde. Dit is reeds vir my duidelik dat die aantal dubbele plusse die norm ver oorskry.

Hier is die digitale data oor die voordele van die eerste deel van die pos. Die grafiek toon die aantal pluspunte vir enkel-, dubbel- en drievoudige posisies in die totale aantal graderings wat gegee is. Soos vroeër genoem, is die metingsinterval 10 minute.

Oor die eienaardighede van habrostatistiek

Van die 30 steek in 84 selle, is twee selle drie keer gesteek. Wel, ek weet nie hoeveel dit ooreenstem met waarskynlikheidsteorie nie ...

Data vir die tweede deel van die pos (aangesien die meetperiode langer is, verkort ek dit volgens die duur van die eerste deel, vir vergelykbaarheid):

Oor die eienaardighede van habrostatistiek

Terloops, hier is een van die enkele pluspunte betyds aangrensend aan die verdriedubbelde een, dit wil sê, in sowat 20 minute was daar 'n toename in pluspunte (29% van hul totale aantal was pluspunte). En dit het nie in die eerste minute van publikasie gebeur nie.

Die verhouding tussen enkel-, dubbel- en drievoudige posisies is ongeveer dieselfde as vir die eerste deel. En die afname in die aandeel van graderings in metings word verklaar deur die feit dat graderings minder gereeld gegee is. Metings is geneem, maar geen voordele is aangeteken nie.

Ek kan hierdie blok plus effek op geen manier verduidelik nie, dit wil sê glad nie. Vir nadele blyk sulke "blokagtige" gedrag nie tipies te wees nie.

Stuur goedheiduitstralers voorstelle in bondels, aan- en afskakel? Hehehehe...

PS
As iemand poststatistieke met meer gevorderde metodes wil ontleed of die rekenkunde wil nagaan, is die lêers met die brondata hier:
yadi.sk/d/iN4SL6tzsGEQxw

Ek dring nie aan op my twyfel nie - miskien is ek verkeerd, veral omdat die statistieke duister is. Ek hoop dat kommentaar van professionele statistici, sielkundiges en ander belangstellende gebruikers die verwarring wat ontstaan ​​het, sal opklaar.

Dankie vir jou aandag.

Bron: will.com

Voeg 'n opmerking