Om habrostatistikens konstigheter

Jag har märkt konstigt beteende i betyg tidigare, men på senare tid har konstigheten blivit för uppenbar. Och jag bestämde mig för att undersöka problemet med hjälp av de vetenskapliga metoder som finns tillgängliga för mig, nämligen: att analysera dynamiken i plus-minus. Inbillade du dig plötsligt?

Jag är fortfarande programmerare, men jag kan göra väldigt grundläggande saker. Så jag kodade ett enkelt verktyg som samlar in statistik från panelerna i Khabrov-inlägget: fördelar, nackdelar, vyer, bokmärken, etc.

Om habrostatistikens konstigheter

Statistiken visas i grafer, efter att ha studerat vilka vi kunde upptäcka ytterligare ett par överraskningar, mindre. Men först till kvarn.

Konstighet 1.
Det var där min statistiska forskning faktiskt började.

Det verkade konstigt för mig att de under de första timmarna efter publiceringen av några av mina inlägg blev kraftigt negativa, sedan gick till noll och så småningom fick det förväntade pluset. Varför hände det?

Jag skulle precis publicera ett till inlägg – i två delar. Jag bestämde mig för att utsätta honom för statistisk analys.

Publicerade första delen. Samtidigt startade jag verktyget och började vänta på resultatet. Tyvärr, på natten - när jag sov - slutade programmet att samla in information på grund av en bugg. Nästa morgon rättade jag till felet, men statistiken visade sig vara mindre än ett dygn. Men trenderna är också uppenbara för den arbetade tiden.

Data tillhandahålls för de första 14 timmarna från publiceringsögonblicket, intervallet mellan mätningarna är 10 minuter.

Om habrostatistikens konstigheter

Ögonen bedrog oss inte: de flesta av nackdelarna inträffar under den första timmen av inläggets existens. Först gick inlägget in i negativt territorium, sedan återhämtade det sig. Här är siffrorna som används för att rita grafen:

Om habrostatistikens konstigheter

Och detta trots att visningarna ökar smidigt!

Om habrostatistikens konstigheter

Stegen som börjar från tusendelsvärden förklaras av det faktum att förkortningar börjar i Khabrov-panelen: det finns ingenstans att få det exakta antalet visningar (förmodligen kunde det ha tagits från tredjepartstjänster, men jag använde dem inte ).

Jag är ingen expert på statistik, men en sådan fördelning av minus är onormal, vad jag förstår?!

Titta, bokmärkena fördelas mer eller mindre jämnt över registreringsperioden:

Om habrostatistikens konstigheter

Kommentarerna är också jämnt fördelade:

Om habrostatistikens konstigheter

Det finns utbrott av aktivitet och passivitet, men de är också fördelade över perioden: kommentarer antingen bleknar eller återupptas.

Samma sak med prenumeranter – det finns en enhetlig liten ökning:

Om habrostatistikens konstigheter

Karma förändrades inte under rapporteringsperioden - jag citerar det inte. Och betyget räknas ut av Habr, det är ingen idé att lista det.

Alla indikatorer ändras i proportion till antalet visningar, och bara med minusen är något fel: ilskautbrottet inträffar under den första timmen från publiceringens början. Samma sak hände med mina tidigare inlägg. Men om det tidigare så att säga var personliga intryck, så bekräftas de nu genom registrering.

Enligt min rena noob-uppfattning innebär en sådan fördelning: det finns flera användare på sajten som målmedvetet tittar på de senast publicerade inläggen och nedröstar några av inläggen - utifrån ett behov som bara de känner till. Jag skriver "några av inläggen" eftersom jag märkte denna effekt inte bara i mina publikationer. I alla fall är effekten uttalad, annars hade jag helt enkelt inte uppmärksammat det.

Jag har fyra versioner av varför detta händer.

Version 1. Mental perversion. Sjuka människor vakar medvetet över författare som de tycker är obehagliga och nedröstar dem, med målet att skada dem.

Jag tror inte på den här versionen.

Version 2. Psykologisk effekt. Vilken - jag vet inte. Tja, varför minusar läsarna först enhälligt inlägget, för att sedan inte mindre enhälligt rösta upp det? Är de minus som icke-tematiska, men plus efter skönhetskännare befinner sig i majoritet? Jag vet inte.

Om det finns psykologer bland läsarna, låt dem säga sitt.

Version 3. Tjänstefolket agerar. Varför skulle deras chefer sprida röta på Khabrovs poster? Gud vet. Det finns dock militärer inte bara i vårt land. Vem kommer att förstå dem, Russofober?!

Version 4. Kombinerade effekter av de tidigare nämnda faktorerna.

Ganska tänkbart.

Hur som helst så lyckas minusare minska antalet visningar. Jag är inte bekant med reglerna för att ta upp Khabrovs inlägg till toppen, jag vet inte ens om dessa algoritmer har offentliggjorts eller inte, men det är uppenbart för mig: tidigt minus tillåter inte utstötta inlägg att nå toppen - Närmare bestämt fördröjer det att nå dit, vilket i sin tur avsevärt, ibland, minskar antalet visningar.

Såvitt jag förstår finns det inga effektiva sätt att bekämpa denna ondska. Enda sättet är personlig röstning. Endast i det här fallet kan du fastställa vilka profiler som periodiskt spåras och minus senaste inlägg. Det är dock ingen personröstning på Habré (eller snarare, den är inte offentlig).

Men inte allt är så enkelt.

Det dissekerade materialet publicerades som sagt i delar. Efter publiceringen av den andra delen förväntade jag mig en liknande bild: med den initiala utgången i minus och den efterföljande i plus. Effekten visade sig dock vara mycket mer utjämnad: inlägget förvandlades inte till ett minus.

När den andra delen publicerades hade felet åtgärdats, så data ges per dag:

Om habrostatistikens konstigheter

Jag vet inte var utjämningen kom ifrån. Kanske för att det publicerades på lördagen (nedröster fungerar inte på lördagar?) eller för att detta är slutet på tidigare publicerat material.

Men fördelningen av minus är fortfarande ojämn: alla minus inträffar under första hälften av registreringsperioden och minus slutar mycket tidigare än plus. Samtidigt fördelas visningarna över perioden exakt som förra gången - jämnt:

Om habrostatistikens konstigheter

Piggen som inträffade vid tretiden på eftermiddagen är inte sekretessbelagt material. Mitt internet slocknade precis i en timme. Verktyget kunde inte ansluta till webbplatsen.

Om habrostatistikens konstigheter

Allt annat är helt standard.

Bokmärken:

Om habrostatistikens konstigheter

Kommentarer: som förra gången växlar perioder av aktivitet med perioder av tystnad.

Om habrostatistikens konstigheter

Karma. En ökning med ett par enheter registrerades - naturligtvis inte samtidigt:

Om habrostatistikens konstigheter

Och prenumeranter. Det totala antalet förblev oförändrat (uppenbarligen anmälde sig intresserade när den första delen publicerades). Strax runt etttiden på eftermiddagen var det en enda svängning: någon avregistrerade sig – kanske av misstag – men skrev direkt upp sig igen. Om det var en annan person inträffade kompensation: det totala antalet prenumeranter ändrades inte.

Om habrostatistikens konstigheter

Så inläggsstatistik beter sig på ett tydligt och förutsägbart sätt. Alla indikatorer, förutom minusen. Eftersom jag inte ser någon uppenbar anledning till detta tycker jag att minustoppen är åtminstone märklig.

Konstighet 2.
Ibland minskar antalet visningar (vilket naturligtvis är omöjligt), men återgår snart till det normala.

Jag spårade det av misstag, medan jag felsökte programmet, när export-import-funktionen ännu inte hade kopplats till, så motsvarande sicksack saknas på grafen. Du kan ta mitt ord för det - denna effekt observerades två gånger. Flera tusen visningar, plötsligt minskar antalet visningar med ett par hundra, efter 10-20 minuter är det återställt till sin tidigare nivå (utan att ta hänsyn till den naturliga ökningen).

Detta är ganska enkelt: en bugg på sajten. Och det finns inget att tänka på.

Konstighet 3.
Det här var vad som föreföll mig mycket konstigare än de frivilliga första och tekniska andra effekterna. Pluser sker inte var för sig, med en enhetlig fördelning över perioden, utan i block. Men att lägga till är ingen kommentar, när en fråga naturligt följs av ett svar är det en individuell handling!

Ta en närmare titt på resultatgraferna som publicerats ovan: blocken märks.

Kunniga personer nickade till mig om Poisson-fördelningen, men jag kan inte beräkna sannolikheten på egen hand. Om du kan, räkna ut. Det är redan uppenbart för mig att antalet dubbla plus vida överstiger normen.

Här är de digitala uppgifterna om fördelarna med den första delen av inlägget. Grafen visar antalet plus för singel-, dubbel- och trippelpositioner i det totala antalet givna betyg. Som nämnts tidigare är mätintervallet 10 minuter.

Om habrostatistikens konstigheter

Av de 30 petningar i 84 celler, petades två celler tre gånger. Tja, jag vet inte hur mycket detta motsvarar sannolikhetsteorin...

Data för den andra delen av inlägget (eftersom mätperioden är längre, förkortar jag den enligt längden på den första delen, för jämförbarhet):

Om habrostatistikens konstigheter

Förresten, här ligger ett av de enstaka plusen i takt med det tredubblade, det vill säga på cirka 20 minuter var det en ökning av plusen (29 % av deras totala antal var plus). Och detta hände inte under de första minuterna av publiceringen.

Förhållandet mellan singel-, dubbel- och trippelpositioner är ungefär detsamma som för den första delen. Och minskningen av andelen betyg i mätningar förklaras av att betyg gavs mer sällan. Mätningar gjordes, men inga fördelar noterades.

Jag kan inte förklara denna block plus-effekt på något sätt, det vill säga inte alls. För nackdelar, ett sådant "blockigt" beteende verkar inte vara typiskt.

Skickar utsändare av godhet förslag i omgångar, slå på och av? Hehehehe...

PS
Om någon skulle vilja analysera inläggsstatistik med mer avancerade metoder eller kontrollera aritmetiken, finns filerna med källdata här:
yadi.sk/d/iN4SL6tzsGEQxw

Jag insisterar inte på mina tvivel - jag kanske har fel, särskilt eftersom statistiken är dyster. Jag hoppas att kommentarer från professionella statistiker, psykologer och andra intresserade användare ska förtydliga den förvirring som har uppstått.

Tack för er uppmärksamhet.

Källa: will.com

Lägg en kommentar