Sobre las rarezas de la habroestadística

He notado comportamientos extraños en las calificaciones antes, pero recientemente la extrañeza se ha vuelto demasiado obvia. Y decidí investigar el problema utilizando los métodos científicos que tenía a mi alcance, a saber: analizar la dinámica de más-menos. ¿Te imaginaste de repente?

Todavía soy programador, pero puedo hacer cosas muy básicas. Así que codifiqué una utilidad simple que recopila estadísticas de los paneles de la publicación de Khabrov: pros, contras, vistas, marcadores, etc.

Sobre las rarezas de la habroestadística

Las estadísticas se muestran en gráficos, tras estudiarlos pudimos descubrir un par de sorpresas más, más pequeñas. Pero primero lo primero.

Extrañeza 1.
Aquí es donde realmente comenzó mi investigación estadística.

Me pareció extraño que en las primeras horas después de la publicación de algunas de mis publicaciones fueran bruscamente negativas, luego bajaran a cero y finalmente obtuvieran el plus esperado. ¿Por qué sucedió?

Estaba a punto de publicar otra entrada, en dos partes. Decidí someterlo a un análisis estadístico.

Publicada la primera parte. Al mismo tiempo, inicié la utilidad y comencé a esperar el resultado. Desafortunadamente, por la noche, mientras dormía, el programa dejó de recopilar información debido a un error. A la mañana siguiente corregí el error, pero las estadísticas resultaron ser de menos de un día. Sin embargo, las tendencias también son evidentes para el tiempo trabajado.

Los datos se proporcionan durante las primeras 14 horas desde el momento de la publicación, el intervalo entre mediciones es de 10 minutos.

Sobre las rarezas de la habroestadística

Los ojos no nos engañaron: la mayoría de los inconvenientes ocurren en la primera hora de existencia del puesto. Al principio la publicación entró en territorio negativo, luego se recuperó. Aquí están los números utilizados para trazar el gráfico:

Sobre las rarezas de la habroestadística

¡Y esto a pesar de que las visitas aumentan sin problemas!

Sobre las rarezas de la habroestadística

Los pasos a partir de los valores de milésimas se explican por el hecho de que las abreviaturas comienzan en el panel de Khabrov: no hay ningún lugar para obtener el número exacto de vistas (probablemente podría haber sido tomado de servicios de terceros, pero no los usé). ).

No soy un experto en estadística, pero tal distribución de desventajas es anormal, según tengo entendido.

Mira, los marcadores se distribuyen de forma más o menos uniforme durante el periodo de registro:

Sobre las rarezas de la habroestadística

Los comentarios también se distribuyen uniformemente:

Sobre las rarezas de la habroestadística

Hay estallidos de actividad y pasividad, pero también se distribuyen a lo largo del período: los comentarios se desvanecen o se reanudan.

Lo mismo ocurre con los suscriptores: hay un ligero aumento uniforme:

Sobre las rarezas de la habroestadística

El karma no cambió durante el período del informe; no lo cito. Y la calificación la calcula Habr, no tiene sentido incluirla en la lista.

Todos los indicadores cambian en proporción al número de visitas, y sólo con los inconvenientes algo anda mal: el estallido de ira se produce en la primera hora desde el inicio de la publicación. Lo mismo pasó con mis publicaciones anteriores. Pero si antes eran, por así decirlo, impresiones personales, ahora se confirman mediante el registro.

En mi opinión puramente novata, tal distribución significa: hay varios usuarios en el sitio que ven intencionalmente las últimas publicaciones publicadas y rechazan algunas de las publicaciones, basándose en una necesidad que solo ellos conocen. Escribo “algunos de los posts” porque noté este efecto no solo en mis publicaciones. En todos los casos, el efecto es pronunciado, de lo contrario simplemente no le habría prestado atención.

Tengo cuatro versiones de por qué sucede esto.

Versión de 1. Perversión mental. Los enfermos vigilan deliberadamente a los autores que les parecen desagradables y los rechazan, con el objetivo de hacerles daño.

No creo en esta versión.

Versión de 2. Efecto psicológico. Cuál... no lo sé. Bueno, ¿por qué los lectores primero rechazan unánimemente la publicación y luego, no menos unánimemente, la votan a favor? ¿Son menos como no temáticos, pero más después de que los conocedores de la belleza son mayoría? No lo sé.

Si hay psicólogos entre los lectores, que expresen su opinión.

Versión de 3. Los sirvientes están actuando. ¿Por qué sus jefes deberían esparcir podredumbre en los puestos de Khabrov? Dios lo sabe. Sin embargo, no sólo en nuestro país hay militares. ¿Quién los entenderá, rusófobos?

Versión de 4. Efectos combinados de los factores anteriormente mencionados.

Bastante imaginable.

Sea como fuere, los usuarios negativos logran reducir el número de visitas. No estoy familiarizado con las reglas para llevar las publicaciones de Khabrov a la cima, ni siquiera sé si estos algoritmos se han hecho públicos o no, pero para mí es obvio: los primeros inconvenientes no permiten que las publicaciones condenadas al ostracismo lleguen a la cima. más precisamente, retrasa llegar allí, lo que a su vez reduce significativamente, en ocasiones, el número de visitas.

Hasta donde tengo entendido, no existen formas efectivas de combatir este mal. La única manera es el voto personal. Solo en este caso podrá establecer qué perfiles realizan un seguimiento periódico y menos las últimas publicaciones. Sin embargo, no hay votación personal sobre Habré (o mejor dicho, no se hace pública).

Pero no es tan simple.

Como dije, el material diseccionado se publicó en partes. Después de la publicación de la segunda parte, esperaba una imagen similar: con la salida inicial en menos y la posterior en más. Sin embargo, el efecto resultó ser mucho más suave: la publicación no se convirtió en un signo negativo.

Cuando se publicó la segunda parte, el error ya se había solucionado, por lo que los datos se dan por día:

Sobre las rarezas de la habroestadística

No sé de dónde salió el alisado. Quizás porque se publicó el sábado (¿los votos negativos no funcionan los sábados?) o porque este es el final del material publicado anteriormente.

Sin embargo, la distribución de las desventajas sigue siendo desigual: todas las desventajas ocurren en la primera mitad del período de registro y las desventajas terminan mucho antes que las ventajas. Al mismo tiempo, las vistas se distribuyen durante el período exactamente como la última vez, de manera uniforme:

Sobre las rarezas de la habroestadística

El repunte que se produjo sobre las tres de la tarde no es material clasificado. Mi internet se fue hace una hora. La utilidad no pudo conectarse al sitio.

Sobre las rarezas de la habroestadística

Todo lo demás es completamente estándar.

Marcadores:

Sobre las rarezas de la habroestadística

Comentarios: como la última vez, se alternan periodos de actividad con periodos de silencio.

Sobre las rarezas de la habroestadística

Karma. Se registró un aumento de un par de unidades, aunque no simultáneamente:

Sobre las rarezas de la habroestadística

Y suscriptores. El número total se mantuvo sin cambios (al parecer, los interesados ​​se apuntaron cuando se publicó la primera parte). Alrededor de la una de la tarde se produjo una única fluctuación: alguien se dio de baja, tal vez por error, pero inmediatamente se volvió a registrar. Si se trataba de otra persona, se producía una compensación: el número total de suscriptores no cambiaba.

Sobre las rarezas de la habroestadística

Por tanto, las métricas de publicaciones se comportan de forma clara y predecible. Todos los indicadores, excepto los menos. Como no veo ninguna razón obvia para esto, el pico negativo me parece al menos extraño.

Extrañeza 2.
A veces, el número de visitas disminuye (lo que, por supuesto, es imposible), pero pronto vuelve a la normalidad.

Lo seguí por accidente, mientras depuraba el programa, cuando la función exportar-importar aún no se había adjuntado, por lo que falta el zigzag correspondiente en el gráfico. Puede confiar en mi palabra: este efecto se observó dos veces. Varios miles de visitas, de repente el número de vistas disminuye en un par de cientos, después de 10 a 20 minutos vuelve al nivel anterior (sin tener en cuenta el aumento natural).

Esto es bastante simple: un error en el sitio. Y no hay nada en qué pensar.

Extrañeza 3.
Esto es lo que me pareció mucho más extraño que el primer efecto voluntarista y el segundo efecto técnico. Las ventajas no se producen de forma aislada, con una distribución uniforme a lo largo del período, sino en bloques. Pero añadir no es un comentario, cuando a una pregunta le sigue naturalmente una respuesta, ¡son un acto individual!

Mire más de cerca los gráficos de resultados publicados arriba: los bloques son notables.

Las personas conocedoras me hicieron un gesto con la cabeza sobre la distribución de Poisson, pero no puedo calcular la probabilidad por mi cuenta. Si puedes, haz los cálculos. Ya me resulta obvio que el número de ventajas dobles supera con creces la norma.

Aquí tenéis los datos digitales sobre las ventajas de la primera parte del post. El gráfico muestra el número de ventajas para las posiciones simple, doble y triple en el número total de calificaciones otorgadas. Como se mencionó anteriormente, el intervalo de medición es de 10 minutos.

Sobre las rarezas de la habroestadística

De los 30 pinchazos en 84 celdas, dos celdas fueron pinchadas tres veces. Bueno, no sé hasta qué punto esto corresponde a la teoría de la probabilidad...

Datos de la segunda parte del post (como el periodo de medición es más largo, lo acorto según la duración de la primera parte, para comparar):

Sobre las rarezas de la habroestadística

Por cierto, aquí una de las ventajas individuales es adyacente en el tiempo a la triplicada, es decir, en unos 20 minutos hubo un aumento de ventajas (el 29% de su número total eran ventajas). Y esto no ocurrió en los primeros minutos de publicación.

La relación entre las posiciones simple, doble y triple es aproximadamente la misma que para la primera parte. Y la disminución en la proporción de calificaciones en las mediciones se explica por el hecho de que las calificaciones se otorgaron con menos frecuencia. Se tomaron medidas, pero no se registraron ventajas.

No puedo explicar este efecto block plus de ninguna manera, es decir, en absoluto. Por el contrario, este comportamiento de “bloqueo” no parece ser típico.

¿Los emisores de bondad envían sugerencias en lotes, encendiéndose y apagándose? Jejejeje...

PS
Si alguien desea analizar las estadísticas de publicaciones utilizando métodos más avanzados o comprobar la aritmética, los archivos con los datos fuente están aquí:
yadi.sk/d/iN4SL6tzsGEQxw

No insisto en mis dudas; tal vez me equivoque, sobre todo porque las estadísticas son sombrías. Espero que los comentarios de estadísticos profesionales, psicólogos y otros usuarios interesados ​​aclaren la confusión que ha surgido.

Gracias por su atención.

Fuente: habr.com

Añadir un comentario