Sobre les curiositats de l'habroestadística

Abans he notat un comportament estrany a les valoracions, però recentment l'estranyesa s'ha fet massa evident. I vaig decidir investigar el problema utilitzant els mètodes científics disponibles, a saber: analitzar la dinàmica del més-menys. T'ho has imaginat de sobte?

Encara sóc programador, però puc fer coses molt bàsiques. Així que vaig codificar una utilitat senzilla que recopila estadístiques dels panells de la publicació de Khabrov: pros, contres, vistes, adreces d'interès, etc.

Sobre les curiositats de l'habroestadística

Les estadístiques es mostren en gràfics, després d'estudiar les quals hem pogut descobrir un parell de sorpreses més, més petites. Però primer és el primer.

Estranyesa 1.
Aquí va començar la meva investigació estadística.

Em va semblar estrany que en les primeres hores després de la publicació d'algunes de les meves publicacions fossin fortament negatives, després van passar a zero i finalment van obtenir el plus esperat. Per què va passar?

Estava a punt de publicar una altra entrada, en dues parts. Vaig decidir sotmetre'l a una anàlisi estadística.

Publicada la primera part. Al mateix temps, vaig llançar la utilitat i vaig començar a esperar el resultat. Malauradament, a la nit, mentre dormia, el programa va deixar de recollir informació a causa d'un error. L'endemà al matí vaig corregir l'error, però les estadístiques van resultar ser de menys d'un dia. Tanmateix, les tendències també són evidents pel temps treballat.

Les dades es proporcionen durant les primeres 14 hores des del moment de la publicació, l'interval entre mesures és de 10 minuts.

Sobre les curiositats de l'habroestadística

Els ulls no ens van enganyar: la majoria dels inconvenients es produeixen a la primera hora d'existència del missatge. Al principi, el missatge va entrar en territori negatiu, després es va recuperar. Aquests són els números utilitzats per traçar el gràfic:

Sobre les curiositats de l'habroestadística

I això malgrat que les vistes augmenten sense problemes!

Sobre les curiositats de l'habroestadística

Els passos a partir dels valors de la mil·lèsima s'expliquen pel fet que les abreviatures comencen al tauler de Khabrov: no hi ha cap lloc per obtenir el nombre exacte de visualitzacions (probablement es podria haver pres de serveis de tercers, però no les vaig utilitzar). ).

No sóc un expert en estadístiques, però aquesta distribució de desavantatges és anormal, pel que entenc?!

Mira, els marcadors es distribueixen de manera més o menys uniforme durant el període de registre:

Sobre les curiositats de l'habroestadística

Els comentaris també es distribueixen de manera uniforme:

Sobre les curiositats de l'habroestadística

Hi ha esclats d'activitat i passivitat, però també es distribueixen al llarg del període: els comentaris s'esvaeixen o es reprendran.

El mateix amb els subscriptors: hi ha un lleuger augment uniforme:

Sobre les curiositats de l'habroestadística

El karma no va canviar durant el període d'informe; no ho estic citant. I la qualificació la calcula Habr, no té sentit enumerar-la.

Tots els indicadors canvien en proporció al nombre de visualitzacions, i només amb els inconvenients hi ha alguna cosa malament: l'esclat d'ira es produeix en la primera hora des de l'inici de la publicació. El mateix va passar amb les meves publicacions anteriors. Però si abans eren, per dir-ho d'alguna manera, impressions personals, ara es confirmen mitjançant el registre.

En la meva opinió purament noob, aquesta distribució significa: hi ha diversos usuaris al lloc que veuen deliberadament les últimes publicacions i voten en contra d'algunes de les publicacions, segons una necessitat que només ells coneixen. Escric "algunes de les publicacions" perquè vaig notar aquest efecte no només a les meves publicacions. En tots els casos, l'efecte és pronunciat, sinó simplement no hi hauria parat atenció.

Tinc quatre versions de per què passa això.

Versió 1. Perversió mental. Els malalts vetllen deliberadament sobre els autors que troben desagradables i els voten negativament, amb l'objectiu de perjudicar-los.

No crec en aquesta versió.

Versió 2. Efecte psicològic. Quina - no ho sé. Bé, per què els lectors primer per unanimitat menys la publicació i després no menys per unanimitat la voten a favor? Són menys com a no temàtics, però més després que els coneixedors de la bellesa es troben en la majoria? No ho sé.

Si entre els lectors hi ha psicòlegs, que diguin la seva.

Versió 3. Els criats actuen. Per què els seus caps haurien d'escampar podridura a les publicacions de Khabrov? Déu ho sap. No obstant això, hi ha militars no només al nostre país. Qui els entendrà, russòfobs?!

Versió 4. Efectes combinats dels factors esmentats anteriorment.

Bastant imaginable.

Sigui com sigui, els minusers aconsegueixen reduir el nombre de visualitzacions. No conec les regles per portar les publicacions de Khabrov a la part superior, ni tan sols sé si aquests algorismes s'han fet públics o no, però és obvi per a mi: el minus primerenc no permet que les publicacions ostracitzades arribin a la part superior - més precisament, retarda arribar-hi, cosa que al seu torn redueix significativament, de vegades, el nombre de visualitzacions.

Pel que entenc, no hi ha maneres efectives de combatre aquest mal. L'única manera és el vot personal. Només en aquest cas podeu establir quins perfils fan un seguiment periòdic i menys les publicacions més recents. Tanmateix, no hi ha votació personal sobre Habré (o millor dit, no es fa públic).

Però no és tan senzill.

Com he dit, el material dissecat es va publicar per parts. Després de la publicació de la segona part, m'esperava una imatge semblant: amb la sortida inicial en el menys i la posterior en el més. Tanmateix, l'efecte va resultar molt més suavitzat: la publicació no es va convertir en un negatiu.

Quan es va publicar la segona part, l'error s'havia corregit, de manera que les dades es donen per dia:

Sobre les curiositats de l'habroestadística

No sé d'on ha vingut el suavitzat. Potser perquè es va publicar dissabte (els dissabtes no funcionen els vots en contra?) o perquè aquest és el final del material publicat anteriorment.

No obstant això, la distribució dels inconvenients encara és desigual: tots els negatius es produeixen a la primera meitat del període de registre i el menys acaba molt abans que el més. Al mateix temps, les visualitzacions es distribueixen durant el període exactament com la darrera vegada, de manera uniforme:

Sobre les curiositats de l'habroestadística

El repunt que es va produir cap a les tres de la tarda no és material classificat. La meva internet només es va apagar durant una hora. La utilitat no s'ha pogut connectar al lloc.

Sobre les curiositats de l'habroestadística

Tota la resta és completament estàndard.

Adreces d'interès:

Sobre les curiositats de l'habroestadística

Comentaris: com l'última vegada, s'alternen períodes d'activitat amb períodes de silenci.

Sobre les curiositats de l'habroestadística

Karma. Es va registrar un augment d'un parell d'unitats, per descomptat, no simultània:

Sobre les curiositats de l'habroestadística

I subscriptors. El nombre total es va mantenir sense canvis (aparentment, els interessats es van apuntar quan es va publicar la primera part). Al voltant de la una de la tarda hi va haver una única fluctuació: algú es va donar de baixa –potser per error– però de seguida es va tornar a apuntar. Si es tractava d'una persona diferent, es produïa una compensació: el nombre total de subscriptors no canviava.

Sobre les curiositats de l'habroestadística

Per tant, les mètriques de publicació es comporten de manera clara i previsible. Tots els indicadors, excepte els inconvenients. Com que no veig cap raó òbvia per a això, trobo que el pic menys és almenys estrany.

Estranyesa 2.
De vegades el nombre de visualitzacions disminueix (cosa que, és clar, és impossible), però aviat torna a la normalitat.

El vaig seguir per accident, mentre depurava el programa, quan encara no s'havia adjuntat la funció d'exportació-importació, de manera que falta la ziga-zaga corresponent al gràfic. Podeu creure la meva paraula: aquest efecte es va observar dues vegades. Diversos milers de visualitzacions, de sobte el nombre de visualitzacions disminueix un parell de centenars, després de 10-20 minuts es torna al seu nivell anterior (sense tenir en compte l'augment natural).

Això és bastant senzill: un error al lloc. I no hi ha res en què pensar.

Estranyesa 3.
Això és el que em va semblar molt més estrany que el primer efecte voluntaristic i el segon efecte tècnic. Els avantatges no es donen per separat, amb una distribució uniforme al llarg del període, sinó per blocs. Però afegir no és un comentari, quan una pregunta va seguida naturalment d'una resposta, són un acte individual!

Mireu més de prop els gràfics de resultats publicats anteriorment: els blocs es noten.

La gent coneixedora em va dir amb el cap sobre la distribució de Poisson, però no sóc capaç de calcular la probabilitat pel meu compte. Si pots, fes les matemàtiques. Ja és obvi per a mi que el nombre de dobles avantatges supera amb escreix la norma.

Aquí teniu les dades digitals sobre els avantatges de la primera part del post. El gràfic mostra el nombre d'avantatges per a posicions simples, dobles i triples en el nombre total de qualificacions donades. Com s'ha esmentat anteriorment, l'interval de mesura és de 10 minuts.

Sobre les curiositats de l'habroestadística

Dels 30 cops en 84 cel·les, dues cel·les es van punxar tres vegades. Bé, no sé quant correspon això a la teoria de la probabilitat...

Dades de la segona part del post (com que el període de mesura és més llarg, l'escurço segons la durada de la primera part, per comparar-lo):

Sobre les curiositats de l'habroestadística

Per cert, aquí un dels avantatges únics és adjacent en el temps al triple, és a dir, en uns 20 minuts es va produir un augment de avantatges (el 29% del seu nombre total eren avantatges). I això no va passar en els primers minuts de publicació.

La relació entre posicions simples, dobles i triples és aproximadament la mateixa que per a la primera part. I la disminució de la quota de qualificacions en els mesuraments s'explica pel fet que les valoracions es van donar amb menys freqüència. Es van prendre mesures, però no es van registrar avantatges.

No puc explicar de cap manera aquest efecte de bloc més, és a dir, de cap manera. Per contra, aquest comportament "bloquejat" no sembla ser típic.

Els emissors de bondat envien suggeriments per lots, encenent i apagant? Hehehehe...

PS
Si algú vol analitzar les estadístiques de publicacions amb mètodes més avançats o comprovar l'aritmètica, els fitxers amb les dades d'origen són aquí:
yadi.sk/d/iN4SL6tzsGEQxw

No insisteixo en els meus dubtes, potser m'equivoco, sobretot perquè les estadístiques són desoladores. Espero que els comentaris d'estadístics professionals, psicòlegs i altres usuaris interessats aclareixin la confusió que s'ha produït.

Gràcies per la seva atenció.

Font: www.habr.com

Afegeix comentari