Om det mærkelige ved habrostatistik

Jeg har før bemærket mærkelig adfærd i vurderinger, men for nylig er mærkeligheden blevet for tydelig. Og jeg besluttede at undersøge problemet ved hjælp af de videnskabelige metoder, jeg har til rådighed, nemlig: at analysere dynamikken i plus-minus. Har du pludselig forestillet dig?

Jeg er stadig programmør, men jeg kan meget basale ting. Så jeg kodede et simpelt værktøj, der indsamler statistik fra panelerne i Khabrov-indlægget: fordele, ulemper, synspunkter, bogmærker osv.

Om det mærkelige ved habrostatistik

Statistikken vises i grafer, efter at have studeret, som vi var i stand til at opdage et par flere overraskelser, mindre. Men først ting først.

Mærkelighed 1.
Det var her, min statistiske forskning faktisk begyndte.

Det virkede mærkeligt for mig, at de i de første timer efter offentliggørelsen af ​​nogle af mine indlæg gik skarpt i negativ, for derefter at gå i nul og til sidst opnåede det forventede plus. Hvorfor skete det?

Jeg var lige ved at udgive endnu et indlæg – i to dele. Jeg besluttede at udsætte ham for statistisk analyse.

Udgav første del. Samtidig lancerede jeg værktøjet og begyndte at vente på resultatet. Om natten - mens jeg sov - holdt programmet desværre op med at indsamle information på grund af en fejl. Næste morgen rettede jeg fejlen, men statistikken viste sig at være på under et døgn. Tendenserne er dog også tydelige for den tid, der er arbejdet.

Dataene leveres for de første 14 timer fra tidspunktet for offentliggørelsen, intervallet mellem målingerne er 10 minutter.

Om det mærkelige ved habrostatistik

Øjnene bedragede os ikke: De fleste af minusserne opstår i den første time af postens eksistens. Først gik posten ind på negativt territorium, så kom det sig. Her er tallene, der bruges til at plotte grafen:

Om det mærkelige ved habrostatistik

Og det på trods af, at visningerne stiger jævnt!

Om det mærkelige ved habrostatistik

Trinene, der starter fra tusindedelværdier, forklares ved, at forkortelser begynder i Khabrov-panelet: der er ingen steder at få det nøjagtige antal visninger (sandsynligvis kunne det være taget fra tredjepartstjenester, men jeg brugte dem ikke ).

Jeg er ikke ekspert i statistik, men sådan en fordeling af minusser er unormal, så vidt jeg forstår?!

Se, bogmærkerne er fordelt mere eller mindre jævnt over registreringsperioden:

Om det mærkelige ved habrostatistik

Kommentarer er også jævnt fordelt:

Om det mærkelige ved habrostatistik

Der er udbrud af aktivitet og passivitet, men de er også fordelt over perioden: kommentering enten falmer eller genoptages.

Det samme med abonnenter – der er en ensartet lille stigning:

Om det mærkelige ved habrostatistik

Karma ændrede sig ikke i løbet af rapporteringsperioden - jeg citerer det ikke. Og vurderingen er beregnet af Habr, det nytter ikke noget at liste den op.

Alle indikatorer ændrer sig i forhold til antallet af visninger, og kun med minusser er der noget galt: vredesudbruddet opstår i den første time fra begyndelsen af ​​offentliggørelsen. Det samme skete med mine tidligere indlæg. Men hvis det tidligere så at sige var personlige indtryk, bekræftes de nu ved registrering.

Efter min rene noob mening betyder sådan en fordeling: Der er flere brugere på siden, som målrettet ser de seneste publicerede indlæg og nedvoter nogle af indlæggene – ud fra et behov, som kun dem kender. Jeg skriver "nogle af indlæggene", fordi jeg ikke kun bemærkede denne effekt i mine publikationer. I alle tilfælde er effekten udtalt, ellers havde jeg simpelthen ikke været opmærksom på den.

Jeg har fire versioner af, hvorfor dette sker.

Version 1. Mental perversion. Syge mennesker holder bevidst øje med forfattere, de finder ubehagelige, og nedstemmer dem med det formål at skade dem.

Jeg tror ikke på denne version.

Version 2. Psykologisk effekt. Hvilken - jeg ved det ikke. Jamen, hvorfor minuserer læserne først enstemmigt indlægget, for så ikke mindre enstemmigt at stemme op? Er de minus som ikke-tematiske, men plus efter skønhedskendere befinder sig i flertal? Jeg ved ikke.

Hvis der er psykologer blandt læserne, så lad dem sige deres mening.

Version 3. Tjenerne handler. Hvorfor skulle deres chefer sprede råd på Khabrovs stillinger? Gud ved det. Der er dog ikke kun soldater i vores land. Hvem vil forstå dem, Russofober?!

Version 4. Kombinerede effekter af de tidligere nævnte faktorer.

Ganske tænkeligt.

Hvorom alting er, så formår minusere at reducere antallet af visninger. Jeg er ikke bekendt med reglerne for at bringe Khabrovs indlæg til toppen, jeg ved ikke engang om disse algoritmer er blevet offentliggjort eller ej, men det er indlysende for mig: tidlig minus tillader ikke udstødte indlæg at nå toppen - mere præcist forsinker det at komme dertil, hvilket igen betydeligt i perioder reducerer antallet af visninger.

Så vidt jeg forstår, er der ingen effektive måder at bekæmpe dette onde på. Den eneste måde er personlig afstemning. Kun i dette tilfælde kan du fastslå, hvilke profiler der periodisk spores og minus seneste indlæg. Der er dog ingen personlig afstemning på Habré (eller rettere sagt, den offentliggøres ikke).

Men ikke alt er så simpelt.

Det dissekerede materiale blev som sagt udgivet i dele. Efter offentliggørelsen af ​​den anden del forventede jeg et lignende billede: med det oprindelige output i minus og det efterfølgende i plus. Effekten viste sig dog at være meget mere udjævnet: indlægget blev ikke til et minus.

Da anden del blev offentliggjort, var fejlen blevet rettet, så dataene er givet pr. dag:

Om det mærkelige ved habrostatistik

Jeg ved ikke, hvor udjævningen kom fra. Måske fordi det blev udgivet om lørdagen (nedstemmer virker ikke om lørdagen?), eller fordi dette er slutningen på tidligere offentliggjort materiale.

Fordelingen af ​​minusser er dog stadig ujævn: alle minusser forekommer i første halvdel af registreringsperioden, og minus slutter meget tidligere end plus. Samtidig er visningerne fordelt over perioden præcis som sidste gang - ligeligt:

Om det mærkelige ved habrostatistik

Piggen, der skete omkring tre om eftermiddagen, er ikke klassificeret materiale. Mit internet gik lige ud i en time. Hjælpeprogrammet kunne ikke oprette forbindelse til webstedet.

Om det mærkelige ved habrostatistik

Alt andet er helt standard.

Bogmærker:

Om det mærkelige ved habrostatistik

Kommentarer: Ligesom sidste gang veksler perioder med aktivitet med perioder med stilhed.

Om det mærkelige ved habrostatistik

Karma. En stigning på et par enheder blev registreret - selvfølgelig ikke samtidig:

Om det mærkelige ved habrostatistik

Og abonnenter. Det samlede antal forblev uændret (tilsyneladende tilmeldte interesserede sig, da den første del blev offentliggjort). Lige omkring klokken et om eftermiddagen var der et enkelt udsving: nogen meldte sig ud - måske ved en fejl - men meldte sig straks til igen. Hvis det var en anden person, skete der kompensation: det samlede antal abonnenter ændrede sig ikke.

Om det mærkelige ved habrostatistik

Så post-metrics opfører sig på en klar og forudsigelig måde. Alle indikatorer, undtagen minusserne. Da jeg ikke ser nogen åbenlys grund til dette, synes jeg minustoppen i det mindste er mærkelig.

Mærkelighed 2.
Nogle gange falder antallet af visninger (hvilket selvfølgelig er umuligt), men vender snart tilbage til det normale.

Jeg sporede det ved et uheld, mens jeg fejlede programmet, da eksport-import-funktionen endnu ikke var tilknyttet, så den tilsvarende zigzag mangler på grafen. Du kan tage mit ord for det - denne effekt blev observeret to gange. Flere tusinde visninger, pludselig falder antallet af visninger med et par hundrede, efter 10-20 minutter er det genoprettet til dets tidligere niveau (uden at tage højde for den naturlige stigning).

Dette er ret simpelt: en fejl på webstedet. Og der er ikke noget at tænke på.

Mærkelighed 3.
Dette er, hvad der forekom mig meget mærkeligere end de frivillige første og tekniske sekundeffekter. Plusser sker ikke enkeltvis, med en ensartet fordeling over perioden, men i blokke. Men tilføjelse er ikke en kommentar, når et spørgsmål naturligt efterfølges af et svar, er det en individuel handling!

Se nærmere på resultatgraferne, der er offentliggjort ovenfor: blokkene er mærkbare.

Kyndige folk nikkede til mig om Poisson-fordelingen, men jeg er ikke i stand til at beregne sandsynligheden på egen hånd. Hvis du er i stand, så lav regnestykket. Det er allerede indlysende for mig, at antallet af dobbelte plusser langt overstiger normen.

Her er de digitale data om fordelene ved første del af indlægget. Grafen viser antallet af plusser for enkelt-, dobbelt- og tredobbelt positioner i det samlede antal af givet vurderinger. Som tidligere nævnt er måleintervallet 10 minutter.

Om det mærkelige ved habrostatistik

Af de 30 stik i 84 celler blev to celler prikket tre gange. Nå, jeg ved ikke, hvor meget det svarer til sandsynlighedsteori...

Data for anden del af indlægget (da måleperioden er længere, forkorter jeg den i henhold til varigheden af ​​den første del, for sammenlignelighed):

Om det mærkelige ved habrostatistik

Forresten, her støder et af de enkelte plusser i tid op til det tredobbelte, det vil sige, på omkring 20 minutter var der en stigning i plusser (29 % af deres samlede antal var plusser). Og dette skete ikke i de første minutter af offentliggørelsen.

Forholdet mellem enkelt-, dobbelt- og tredobbeltpositioner er omtrent det samme som for første del. Og faldet i andelen af ​​vurderinger i målinger forklares med, at vurderinger blev givet sjældnere. Der blev foretaget målinger, men der blev ikke registreret nogen fordele.

Jeg kan ikke forklare denne blok plus effekt på nogen måde, det vil sige slet ikke. Til ulemper synes en sådan "blokeret" adfærd ikke at være typisk.

Sender udsender af godhed forslag i batches, tænder og slukker? Hehehehe...

PS
Hvis nogen vil analysere poststatistikker ved hjælp af mere avancerede metoder eller kontrollere aritmetikken, er filerne med kildedataene her:
yadi.sk/d/iN4SL6tzsGEQxw

Jeg insisterer ikke på min tvivl - måske tager jeg fejl, især da statistikkerne er dystre. Jeg håber, at kommentarer fra professionelle statistikere, psykologer og andre interesserede brugere vil afklare den forvirring, der er opstået.

Tak for din opmærksomhed.

Kilde: www.habr.com

Tilføj en kommentar