La ciudad se duerme, los habitantes de Khabrovsk se despiertan

Si el número de comentarios sobre un artículo se acerca rápidamente a los 1000, tenga la seguridad de que, independientemente del tema planteado por el autor, en el interior se está librando una riña: puntos álgidos de la política, rodeados de expertos de sillón en todos los temas, diagnósticos psiquiátricos a distancia por avatar y apodo, recibiendo ataques personales, sarcásticos, cuya causticidad excede la de la sangre de los xenomorfos y, por supuesto, el plato obligatorio en tales casos son las acusaciones mutuas que su contraparte está discutiendo con usted únicamente por remuneración o por deber. Lo cual, aparentemente, es peligroso y difícil, y a primera vista parece no ser visible, y no hay treinta monedas de plata en el camino.

Lo curioso de esta situación es queque las personas profundamente afectadas por el síndrome en-internet-alguien-se-equivoca, a menudo dedican mucho tiempo y nervios a completamente gratis demostrarle a otra persona igualmente sorprendida que está haciendo exactamente lo mismo por dinero o por orden. ¿Estás buscando lógica aquí? Ella se ha ido. Es Internet, cariño.

Tomemos uno de mierda relativamente nueva sobre supuesta discriminación territorial en Gitlab. Han pasado 4 días desde la publicación del artículo y, por supuesto, la discusión hace tiempo que se alejó mucho del tema planteado originalmente. Suenan las siguientes frases:

Una persona real no podrá oponer nada a un comentarista profesional en una suscripción...

El usuario (fulano de tal) dedica una cantidad de tiempo poco realista a los comentarios...
Además, su actividad no sigue los patrones que suelen ser característicos de un usuario común y corriente....

PD. pero esto me dio la idea de escribir un analizador sintáctico para estos comentaristas) Con una indicación de actividad por hora, cantidad de tiempo por día, por semana, etc... Un buen tema para un artículo)

Está bien, detente. ¿Qué tipo de patrones son “normalmente inherentes al usuario medio”? El autor de esta frase en ese hilo, lamentablemente, ya ha sido transcrito, por lo que tendrás que ir al azar.

La pregunta que quiero plantear ante sus ojos claros es la siguiente: ¿es siquiera posible, utilizando métodos estadísticos, identificar al menos de manera confiable estos mismos patrones para crear un clasificador formal que distinga a los comentaristas casuales de los profesionales? Imagínese: "según el Habra-botometer, tiene un 76% de probabilidades de ser un Kremlinbot". Esto será mucho más genial que las incursiones kármicas entre sí.
Desafortunadamente, mis competencias no son suficientes ni siquiera para sugerir en qué dirección profundizar para resolver tal problema. Sin embargo, anoche hackeé un pequeño analizador primitivo que (afortunadamente, las páginas con comentarios están abiertas incluso a visitantes no autorizados) hasta ahora hace dos cosas: a) recopila estadísticas de un nombre de usuario determinado de todos sus comentarios (por ahora solo marca de tiempo ) y lo agrega a la base de datos MySQL; b) dibuja un diagrama de tiempo, marcando en él los eventos de envío de comentarios extraídos de esta base de datos. Incluso sin ningún análisis sofisticado, resultó bastante divertido. Así es como se ve mi cuadro de comentarios. Las explicaciones están a continuación. Lo mejor es verlo en una ventana separada a una escala del 100% o más.

La ciudad se duerme, los habitantes de Khabrovsk se despiertan

El eje horizontal es el tiempo, cada píxel es igual a un minuto, el valor de las divisiones grises es igual a una hora, toda la línea horizontal es igual a un día. Los días van de abajo hacia arriba a lo largo del eje vertical, el valor de división es 365 días.

No hay nada particularmente interesante en mi diagrama. Se puede ver que me gusta dormir de 7 a 8 horas, a menudo me acuesto después de medianoche y, a veces, hago maratones de comentarios que duran horas, y que la actividad durante el último año es mayor o aproximadamente igual a la de los cinco años anteriores. .
O aquí hay un camarada gecubo Mantuve un voto de silencio durante tres años y medio, y luego se rompió...

La ciudad se duerme, los habitantes de Khabrovsk se despiertan

El diagrama de actividad de un típico comentarista habra se parece a esto (esto es QtRoS)

La ciudad se duerme, los habitantes de Khabrovsk se despiertan

Un claro “hueco somnoliento” a la izquierda en algún lugar de la noche europea y comentarios pausados ​​durante las horas del día, tal vez con pausas de medio año.

¡Pero no todos los diagramas son tan aburridos! ¿Qué tal esto, por ejemplo?

La ciudad se duerme, los habitantes de Khabrovsk se despiertan

Al parecer, en poco más de dos años, nuestro colega reentrenó sus biorritmos para dormir de la noche europea en algún lugar bajo la Cordillera del Atlántico Medio, de manera uniforme y gradual, y luego tardó otros dos años en regresar a las costas de Portugal. ¿Caminaste? ¿Nadar? No se me ocurren explicaciones plausibles... Durante las primeras tres horas de estar despierto, los comentarios vuelan como una ametralladora, pero al final del día es así, una vez cada hora miro para ver qué está pasando. ahí y listo.

Por cierto, fue 0xd34df00d.

Y aquí hay otro acertijo:

La ciudad se duerme, los habitantes de Khabrovsk se despiertan

El colega duró cuatro años y medio sin un solo comentario; aparentemente, en algún lugar de monasterios secretos estaba entrenando cómo permanecer despierto durante días, a juzgar por la cantidad de comentarios publicados en "sleepy Hollow".

Pero lo más interesante aquí es la anomalía de la hora 16, que dura más de tres años y desaparece gradualmente en el último año. ¿Receso para fumar? ¿Pasear al perro? ¿Correr? ¿Qué más puede apartar a un residente de Khabrov de los comentarios en medio de una jornada laboral con tanta predeterminación diaria? Soy un vago y un holgazán, no puedo imaginar el tipo de autodisciplina que el respetado Khim.

Finalmente, un último diagrama en el que pensar:

La ciudad se duerme, los habitantes de Khabrovsk se despiertan

No hay ningún "hueco somnoliento" claramente definido en él. Apenas se puede percibir el visible exceso en el número de comentarios enviados después del mediodía respecto a los enviados antes.

Con todo el rigor del Komsomol insto a los respetados Mtyrz desármate frente a la fiesta y admite honestamente cuántos abuelos, nietas, bichos y ratones gobiernan tu cuenta y escriben comentarios.

Y finalmente, una pregunta insidiosa: ¿podría alguien estar tan interesado en todo esto que quisiera desarrollar el código del analizador u obtener un volcado de la base de datos o acceder a ella, etc.? Mi propio conocimiento sobre métodos de extracción y visualización de datos apenas supera la erudición general. Difícilmente puedo pensar en algo más inteligente e interesante que estos simples diagramas. Si alguien está interesado que me escriba por telegram (apodo en el perfil).

Gracias por su atención!

UPD. Publicado fuentes en GitHub.

Fuente: habr.com

Añadir un comentario