Si el número de comentarios sobre un artículo se acerca rápidamente a los 1000, tenga la seguridad de que, independientemente del tema planteado por el autor, en el interior se está librando una riña: puntos álgidos de la política, rodeados de expertos de sillón en todos los temas, diagnósticos psiquiátricos a distancia por avatar y apodo, recibiendo ataques personales, sarcásticos, cuya causticidad excede la de la sangre de los xenomorfos y, por supuesto, el plato obligatorio en tales casos son las acusaciones mutuas que su contraparte está discutiendo con usted únicamente por remuneración o por deber. Lo cual, aparentemente, es peligroso y difícil, y a primera vista parece no ser visible, y no hay treinta monedas de plata en el camino.
Lo curioso de esta situación es que
Tomemos uno de
Una persona real no podrá oponer nada a un comentarista profesional en una suscripción...
El usuario (fulano de tal) dedica una cantidad de tiempo poco realista a los comentarios...
Además, su actividad no sigue los patrones que suelen ser característicos de un usuario común y corriente....PD. pero esto me dio la idea de escribir un analizador sintáctico para estos comentaristas) Con una indicación de actividad por hora, cantidad de tiempo por día, por semana, etc... Un buen tema para un artículo)
Está bien, detente. ¿Qué tipo de patrones son “normalmente inherentes al usuario medio”? El autor de esta frase en ese hilo, lamentablemente, ya ha sido transcrito, por lo que tendrás que ir al azar.
La pregunta que quiero plantear ante sus ojos claros es la siguiente: ¿es siquiera posible, utilizando métodos estadísticos, identificar al menos de manera confiable estos mismos patrones para crear un clasificador formal que distinga a los comentaristas casuales de los profesionales? Imagínese: "según el Habra-botometer, tiene un 76% de probabilidades de ser un Kremlinbot". Esto será mucho más genial que las incursiones kármicas entre sí.
Desafortunadamente, mis competencias no son suficientes ni siquiera para sugerir en qué dirección profundizar para resolver tal problema. Sin embargo, anoche hackeé un pequeño analizador primitivo que (afortunadamente, las páginas con comentarios están abiertas incluso a visitantes no autorizados) hasta ahora hace dos cosas: a) recopila estadísticas de un nombre de usuario determinado de todos sus comentarios (por ahora solo marca de tiempo ) y lo agrega a la base de datos MySQL; b) dibuja un diagrama de tiempo, marcando en él los eventos de envío de comentarios extraídos de esta base de datos. Incluso sin ningún análisis sofisticado, resultó bastante divertido. Así es como se ve mi cuadro de comentarios. Las explicaciones están a continuación. Lo mejor es verlo en una ventana separada a una escala del 100% o más.
El eje horizontal es el tiempo, cada píxel es igual a un minuto, el valor de las divisiones grises es igual a una hora, toda la línea horizontal es igual a un día. Los días van de abajo hacia arriba a lo largo del eje vertical, el valor de división es 365 días.
No hay nada particularmente interesante en mi diagrama. Se puede ver que me gusta dormir de 7 a 8 horas, a menudo me acuesto después de medianoche y, a veces, hago maratones de comentarios que duran horas, y que la actividad durante el último año es mayor o aproximadamente igual a la de los cinco años anteriores. .
O aquí hay un camarada
El diagrama de actividad de un típico comentarista habra se parece a esto (esto es
Un claro “hueco somnoliento” a la izquierda en algún lugar de la noche europea y comentarios pausados durante las horas del día, tal vez con pausas de medio año.
¡Pero no todos los diagramas son tan aburridos! ¿Qué tal esto, por ejemplo?
Al parecer, en poco más de dos años, nuestro colega reentrenó sus biorritmos para dormir de la noche europea en algún lugar bajo la Cordillera del Atlántico Medio, de manera uniforme y gradual, y luego tardó otros dos años en regresar a las costas de Portugal. ¿Caminaste? ¿Nadar? No se me ocurren explicaciones plausibles... Durante las primeras tres horas de estar despierto, los comentarios vuelan como una ametralladora, pero al final del día es así, una vez cada hora miro para ver qué está pasando. ahí y listo.
Por cierto, fue
Y aquí hay otro acertijo:
El colega duró cuatro años y medio sin un solo comentario; aparentemente, en algún lugar de monasterios secretos estaba entrenando cómo permanecer despierto durante días, a juzgar por la cantidad de comentarios publicados en "sleepy Hollow".
Pero lo más interesante aquí es la anomalía de la hora 16, que dura más de tres años y desaparece gradualmente en el último año. ¿Receso para fumar? ¿Pasear al perro? ¿Correr? ¿Qué más puede apartar a un residente de Khabrov de los comentarios en medio de una jornada laboral con tanta predeterminación diaria? Soy un vago y un holgazán, no puedo imaginar el tipo de autodisciplina que el respetado
Finalmente, un último diagrama en el que pensar:
No hay ningún "hueco somnoliento" claramente definido en él. Apenas se puede percibir el visible exceso en el número de comentarios enviados después del mediodía respecto a los enviados antes.
Con todo el rigor del Komsomol insto a los respetados
Y finalmente, una pregunta insidiosa: ¿podría alguien estar tan interesado en todo esto que quisiera desarrollar el código del analizador u obtener un volcado de la base de datos o acceder a ella, etc.? Mi propio conocimiento sobre métodos de extracción y visualización de datos apenas supera la erudición general. Difícilmente puedo pensar en algo más inteligente e interesante que estos simples diagramas. Si alguien está interesado que me escriba por telegram (apodo en el perfil).
Gracias por su atención!
UPD. Publicado
Fuente: habr.com