A cidade adormece, os veciños de Khabrovsk espertan

Se o número de comentarios baixo un artigo achégase rapidamente aos 1000, teña a certeza de que, independentemente do tema que afirme o autor, atópase unha liorta no seu interior: focos de polémica, rodeados de expertos en cadeiras en todas as cuestións, diagnósticos psiquiátricos a distancia por avatar. e alcume, recibir ataques persoais e sarcásticos, cuxa causticidade supera a do sangue dos xenomorfos, e, por suposto, o prato obrigado nestes casos son as acusacións mutuas que o teu homólogo está a discutir contigo só por remuneración ou por deber. O que, ao parecer, é perigoso e difícil, e a primeira vista parece non ser visible, e trinta pezas de prata non están na estrada.

O curioso desta situación é isoque as persoas profundamente afectadas pola síndrome en-internet-alguén-está-equivocado, adoita pasar moito tempo e nervios para absolutamente gratuíto demostrarlle a outra persoa igualmente abraiada que está a facer exactamente o mesmo por diñeiro ou por encargo. Buscas a lóxica aquí? Ela foise. É internet, nena.

Imos tomar unha delas merda relativamente fresca sobre suposta discriminación territorial en Gitlab. Pasaron 4 días desde a publicación do artigo e, por suposto, a discusión hai tempo que se alonxa moito do tema inicialmente exposto. Soan as seguintes frases:

Unha persoa real non poderá opoñer nada a un comentarista profesional nunha subscrición...

O usuario (fulano) dedica un tempo pouco realista aos comentarios...
Ademais, a súa actividade non ten patróns que adoitan ser característicos dun usuario común....

ps, pero isto deume a idea de escribir un analizador-analizador para este tipo de comentaristas) Cunha indicación de actividade por hora, cantidade de tempo por día, por semana, etc... Un bo tema para un artigo)

Vale, para. E que tipo de patróns son "normalmente inherentes ao usuario medio"? O autor desta frase nese fío, por desgraza, xa foi transcrito, polo que terás que ir ao chou.

A pregunta que quero facerlles ante os vosos ollos claros é a seguinte: é posible, mediante métodos estatísticos, identificar polo menos de forma fiable estes mesmos patróns para crear un clasificador formal que distinga aos comentaristas casuais dos profesionais? Imaxina: "segundo Habra-botómetro, tes un 76% de probabilidades de ser un Kremlinbot". Isto será moito máis xenial que as incursións kármicas entre si.
Desafortunadamente, as miñas competencias non son suficientes para sequera suxerir que dirección buscar para resolver tal problema. Non obstante, onte á noite pirateei un pequeno analizador primitivo, que (afortunadamente as páxinas con comentarios están abertas incluso para visitantes non autorizados) ata agora fai dúas cousas: a) recolle estatísticas dun nome de usuario determinado de todos os seus comentarios (por agora só selo de tempo). ) e engádeo á base de datos MySQL; b) debuxa un diagrama de tempo, sinalando nel os eventos de envío de comentarios extraídos desta base de datos. Mesmo sen ningunha análise sofisticada resultou ser bastante divertido. Así é o meu gráfico de comentarios. As explicacións están a continuación. É mellor velo nunha xanela separada a unha escala do 100 % ou máis.

A cidade adormece, os veciños de Khabrovsk espertan

O eixe horizontal é o tempo, cada píxel é igual a un minuto, o valor das divisións grises é igual a unha hora, toda a liña horizontal é igual a un día. Os días van de abaixo cara arriba ao longo do eixe vertical, o valor da división é de 365 días.

Non hai nada especialmente interesante no meu diagrama. Pódese ver que me gusta durmir de 7 a 8 horas, moitas veces deitarme despois da medianoite e ás veces teño maratóns de comentarios de horas de duración, e que a actividade do ano pasado é maior ou aproximadamente igual á dos cinco anos anteriores. .
Ou aquí está un compañeiro gecube Mantín un voto de silencio durante tres anos e medio, e despois rompeu...

A cidade adormece, os veciños de Khabrovsk espertan

O diagrama de actividades dun comentarista típico parece algo así (isto é QtRoS)

A cidade adormece, os veciños de Khabrovsk espertan

Un distinto "sleepy hollow" á esquerda nalgún lugar da noite europea e comentarios pausados ​​durante o día, quizais con descansos durante medio ano.

Pero non todos os diagramas son tan aburridos! Que tal isto, por exemplo:

A cidade adormece, os veciños de Khabrovsk espertan

En pouco máis de dous anos, o noso colega, ao parecer, volveu adestrar os seus bioritmos para durmir da noite europea nalgún lugar baixo a dorsal do Atlántico medio, de xeito uniforme e gradual, e despois pasou outros dous anos para volver ás costas de Portugal. Camiñaches? ¿Nadar? Non podo dar explicacións verosímiles... Durante as tres primeiras horas de estar esperto, os comentarios voan coma unha metralleta, pero ao final do día é así, unha vez cada hora miro para ver que pasa. alí e xa está.

Por certo, foi 0xd34df00d.

E aquí tes outro enigma:

A cidade adormece, os veciños de Khabrovsk espertan

O colega durou catro anos e medio sen un só comentario; ao parecer, estaba adestrando nalgún lugar de mosteiros secretos sobre como permanecer esperto durante días, a xulgar por cantos comentarios se publicaron en "sleepy hollow".

Pero o máis interesante aquí é a anomalía á hora 16, que se prolonga durante máis de tres anos e desaparece gradualmente no último ano. ¿Pausa de fume? Paseando o can? Trotar? Que máis pode arrincar a un residente de Khabrov da fonte de comentarios no medio dunha xornada laboral con tanta predeterminación diaria? Son un vagabundo e preguiceiro, non podo imaxinar o tipo de autodisciplina que o respectado khim.

Por último, un último diagrama para pensar:

A cidade adormece, os veciños de Khabrovsk espertan

Non hai un "oco dormilonado" claramente definido. Só un apenas pode discernir o exceso visible no número de comentarios enviados despois do mediodía sobre os enviados antes.

Con todo o rigor Komsomol insto aos respectados MTyrz desarme diante da festa e admite sinceramente cantos avós, netas, bichos e ratos gobernan a túa conta e escribe comentarios.

E, finalmente, unha pregunta insidiosa: podería alguén estar tan interesado en todo isto que quere desenvolver o código do analizador ou conseguir un volcado da base de datos ou acceder a el, etc. Os meus propios coñecementos sobre minería de datos e métodos de visualización de datos apenas superan a erudición xeral. Case non se me ocorre nada máis intelixente e interesante que estes sinxelos diagramas. Se alguén está interesado que me escriba en telegrama (alcume no perfil).

Спасибо за внимание!

UPD. Publicouno fontes en GitHub.

Fonte: www.habr.com

Engadir un comentario