Sobre as rarezas da habroestatística

Xa notei un comportamento estraño nas valoracións, pero recentemente a estrañeza fíxose demasiado evidente. E decidín investigar o problema utilizando os métodos científicos dispoñibles, a saber: analizar a dinámica do plus-menos. Imaxinaches de súpeto?

Aínda son programador, pero podo facer cousas moi básicas. Entón, codifiquei unha utilidade sinxela que recolle estatísticas dos paneis da publicación de Khabrov: pros, contras, vistas, marcadores, etc.

Sobre as rarezas da habroestatística

As estatísticas móstranse en gráficas, despois de estudalas que puidemos descubrir un par de sorpresas máis, máis pequenas. Pero primeiro o primeiro.

Estrañeza 1.
Aquí é onde comezou a miña investigación estatística.

Pareceume estraño que nas primeiras horas despois da publicación dalgunhas das miñas publicacións fosen bruscamente negativos, despois pasaron a cero e finalmente obtiveron o plus esperado. Por que pasou?

Estaba a piques de publicar outro post, en dúas partes. Decidín sometelo a análise estatística.

Publicada a primeira parte. Ao mesmo tempo, lancei a utilidade e comecei a esperar o resultado. Por desgraza, pola noite, mentres eu estaba durmindo, o programa deixou de recoller información debido a un erro. Á mañá seguinte corrixín o erro, pero as estatísticas resultaron ser de menos dun día. Non obstante, as tendencias tamén son evidentes para o tempo traballado.

Os datos ofrécense durante as primeiras 14 horas desde o momento da publicación, o intervalo entre medicións é de 10 minutos.

Sobre as rarezas da habroestatística

Os ollos non nos enganaron: a maioría dos inconvenientes ocorren na primeira hora de existencia do post. Nun primeiro momento o posto entrou en territorio negativo, despois recuperouse. Aquí están os números utilizados para trazar a gráfica:

Sobre as rarezas da habroestatística

E iso a pesar de que as vistas están aumentando sen problemas!

Sobre as rarezas da habroestatística

Os pasos a partir de valores milésimos explícanse polo feito de que as abreviaturas comezan no panel de Khabrov: non hai onde obter o número exacto de vistas (probablemente podería ter sido tomada de servizos de terceiros, pero non as usei ).

Non son un experto en estatísticas, pero esa distribución de menos é anormal, ata onde eu entendo?!

Mira, os marcadores distribúense de forma máis ou menos uniforme durante o período de rexistro:

Sobre as rarezas da habroestatística

Os comentarios tamén se distribúen uniformemente:

Sobre as rarezas da habroestatística

Hai ráfagas de actividade e pasividade, pero tamén se distribúen ao longo do período: o comentario ou se esvaece ou se retoma.

O mesmo cos subscritores: hai un lixeiro aumento uniforme:

Sobre as rarezas da habroestatística

O karma non cambiou durante o período de informe; non o cito. E a cualificación calcúlaa Habr, non serve de nada enumerala.

Todos os indicadores cambian en proporción ao número de visualizacións, e só cos inconvenientes hai algo mal: o estalido de ira prodúcese na primeira hora desde o inicio da publicación. O mesmo pasou coas miñas publicacións anteriores. Pero se antes estas eran, por así dicilo, impresións persoais, agora confírmanse mediante a inscrición.

Na miña opinión puramente novata, tal distribución significa: hai varios usuarios no sitio que ven deliberadamente as últimas publicacións publicadas e votan negativamente algunhas das publicacións, baseándose nunha necesidade que só eles coñecen. Escribo "algunhas das publicacións" porque notei este efecto non só nas miñas publicacións. En todos os casos, o efecto é pronunciado, se non, simplemente non lle tería prestado atención.

Teño catro versións de por que ocorre isto.

Versión 1. Perversión mental. Os enfermos vixían deliberadamente aos autores que lles resultan desagradables e os votan negativamente, co obxectivo de prexudicalos.

Non creo nesta versión.

Versión 2. Efecto psicolóxico. Cal - non sei. Ben, por que os lectores primeiro por unanimidade menos a publicación, despois non menos por unanimidade a votan a favor? Son menos como non temáticos, pero máis despois de que os coñecedores da beleza atópanse na maioría? Eu non sei.

Se hai psicólogos entre os lectores, que digan a súa.

Versión 3. Os criados están actuando. Por que os seus xefes deberían estender podremia nos postos de Khabrov? Deus sabe. Non obstante, hai militares non só no noso país. Quen os entenderá, rusófobos?!

Versión 4. Efectos combinados dos factores anteriormente mencionados.

Moi imaxinable.

Sexa como for, os minusers conseguen reducir o número de visualizacións. Non coñezo as regras para levar as publicacións de Khabrov ao principio, nin sequera sei se estes algoritmos se fixeron públicos ou non, pero é obvio para min: o minus anticipado non permite que as publicacións excluídas cheguen ao principio - máis precisamente, atrasa chegar alí, o que á súa vez reduce significativamente, ás veces, o número de visualizacións.

Polo que entendo, non hai formas eficaces de combater este mal. O único xeito é o voto persoal. Só neste caso podes establecer cales son os perfís que están a seguir periodicamente e menos as publicacións máis recentes. Porén, non hai votación persoal sobre Habré (ou mellor dito, non se fai público).

Pero non todo é tan sinxelo.

Como dixen, o material disecado publicouse por partes. Despois da publicación da segunda parte, esperaba unha imaxe semellante: coa saída inicial no menos e a posterior no plus. Non obstante, o efecto resultou ser moito máis suavizado: a publicación non se converteu nun menos.

Cando se publicou a segunda parte, o erro estaba solucionado, polo que os datos se dan por día:

Sobre as rarezas da habroestatística

Non sei de onde veu o alisado. Quizais porque se publicou o sábado (os sábados non funcionan os votos negativos?) ou porque este é o final do material publicado anteriormente.

Non obstante, a distribución dos menos aínda é desigual: todos os menos ocorren na primeira metade do período de rexistro e o menos remata moito antes que o plus. Ao mesmo tempo, as visualizacións distribúense ao longo do período exactamente igual que a última vez, de xeito uniforme:

Sobre as rarezas da habroestatística

O pico que se produciu ao redor das tres da tarde non é material clasificado. A miña internet só se apagou durante unha hora. A utilidade non puido conectarse ao sitio.

Sobre as rarezas da habroestatística

Todo o demais é completamente estándar.

Marcadores:

Sobre as rarezas da habroestatística

Comentarios: como a última vez, os períodos de actividade alternan con períodos de silencio.

Sobre as rarezas da habroestatística

Karma. Rexistrouse un aumento dun par de unidades, por suposto, non simultánea:

Sobre as rarezas da habroestatística

E subscritores. O número total mantívose sen cambios (ao parecer, os interesados ​​apuntáronse cando se publicou a primeira parte). Ao redor da unha da tarde produciuse unha soa fluctuación: alguén deuse de baixa -quizais por erro- pero deseguido volveu rexistrarse. Se se trataba dunha persoa diferente, produciuse unha compensación: o número total de subscritores non cambiou.

Sobre as rarezas da habroestatística

Polo tanto, as métricas de publicación compórtanse de forma clara e previsible. Todos os indicadores, excepto os negativos. Como non vexo ningunha razón obvia para isto, paréceme cando menos estraño o pico negativo.

Estrañeza 2.
Ás veces o número de visualizacións diminúe (o que, por suposto, é imposible), pero pronto volve á normalidade.

Rastreino por accidente, mentres depuraba o programa, cando aínda non estaba anexada a función de exportación e importación, polo que falta o zigzag correspondente no gráfico. Podes crer na miña palabra: este efecto observouse dúas veces. Varios miles de visualizacións, de súpeto o número de vistas diminúe nun par de centos, despois de 10-20 minutos restablece o seu nivel anterior (sen ter en conta o aumento natural).

Isto é moi sinxelo: un erro no sitio. E non hai nada que pensar.

Estrañeza 3.
Isto é o que me pareceu moito máis estraño que os primeiros efectos voluntaristas e os segundos técnicos. As vantaxes non se producen por separado, cunha distribución uniforme no período, senón por bloques. Pero engadir non é un comentario, cando unha pregunta é seguida naturalmente dunha resposta, son un acto individual.

Bótalle unha ollada máis atenta aos gráficos de resultados publicados anteriormente: nótanse os bloques.

As persoas coñecedoras asentiron para min sobre a distribución de Poisson, pero non son capaz de calcular a probabilidade pola miña conta. Se podes, fai as contas. Xa me resulta obvio que o número de dobres pluses supera con creces a norma.

Aquí tedes os datos dixitais sobre as vantaxes da primeira parte do post. O gráfico mostra o número de pluses atribuíbles ás posicións simples, dobradas e triplicadas no total de valoracións concedidas. Como se mencionou anteriormente, o intervalo de medición é de 10 minutos.

Sobre as rarezas da habroestatística

Dos 30 picos en 84 celas, dúas celas foron pinchadas tres veces. Ben, non sei canto corresponde isto á teoría da probabilidade...

Datos da segunda parte do post (xa que o período de medición é máis longo, acurtoo segundo a duración da primeira parte, para comparabilidade):

Sobre as rarezas da habroestatística

Por certo, aquí un dos plus simples está adxacente no tempo ao triplicado, é dicir, nuns 20 minutos produciuse un aumento de pluses (o 29% do seu total eran pluses). E isto non aconteceu nos primeiros minutos da publicación.

A relación entre posicións simples, dobres e triples é aproximadamente a mesma que para a primeira parte. E a diminución da participación das valoracións nas medicións explícase polo feito de que as valoracións se deron con menos frecuencia. Tomáronse medicións, pero non se rexistraron vantaxes.

Non podo explicar este bloque máis efecto de ningunha maneira, é dicir, en absoluto. Por contra, tal comportamento "bloqueado" non parece ser típico.

Os emisores de bondade envían suxestións por lotes, acendendo e apagando? Jejejeje...

PS
Se alguén quere analizar as estatísticas das publicacións utilizando métodos máis avanzados ou comprobar a aritmética, os ficheiros cos datos de orixe están aquí:
yadi.sk/d/iN4SL6tzsGEQxw

Non insisto nas miñas dúbidas, quizais me equivoque, sobre todo porque as estatísticas son desoladoras. Espero que os comentarios de estatísticos profesionais, psicólogos e outros usuarios interesados ​​aclaren a confusión xurdida.

Grazas pola súa atención.

Fonte: www.habr.com

Engadir un comentario