La ville s'endort, les habitants de Khabrovsk se réveillent

Si le nombre de commentaires sous un article approche rapidement les 1000, rassurez-vous, quel que soit le sujet évoqué par l'auteur, une querelle fait rage à l'intérieur : foyers politiques, entourés d'experts en fauteuil sur tous les sujets, diagnostics psychiatriques à distance par avatar. et surnom, recevant des attaques personnelles et sarcastiques, dont la causticité dépasse celle du sang des xénomorphes, et, bien sûr, le plat obligatoire dans de tels cas est constitué d'accusations mutuelles dont votre homologue discute avec vous uniquement contre rémunération ou par devoir. Ce qui, apparemment, est dangereux et difficile, et à première vue ne semble pas visible, et trente pièces d'argent ne traînent pas sur la route.

Ce qui est drôle dans cette situation, c'est queque les personnes profondément touchées par le syndrome sur Internet, quelqu'un a tort, je passe souvent beaucoup de temps et de nerfs à gratuitement prouver à une autre personne tout aussi étonnée qu'il fait exactement la même chose pour de l'argent ou sur commande. Cherchez-vous de la logique ici? Elle est partie. C'est Internet, bébé.

Prenons-en un merde relativement fraîche à propos de discrimination territoriale présumée sur Gitlab. 4 jours se sont écoulés depuis la publication de l'article et, bien sûr, la discussion s'est depuis longtemps éloignée du sujet initialement évoqué. Les phrases suivantes sonnent :

Une personne réelle ne pourra rien opposer à un commentateur professionnel sur abonnement...

L'utilisateur (un tel) passe un temps irréaliste sur les commentaires...
De plus, son activité ne présente pas de schémas habituellement caractéristiques d'un utilisateur ordinaire....

p.s. mais cela m'a donné l'idée d'écrire un analyseur-analyseur pour de tels commentateurs) Avec une indication de l'activité par heure, durée par jour, par semaine, etc... Un bon sujet pour un article)

D'accord, arrête. Et quels types de modèles sont « généralement inhérents à l’utilisateur moyen » ? L’auteur de cette phrase dans ce fil a malheureusement déjà été transcrit, vous devrez donc y aller au hasard.

La question que je souhaite poser devant vos yeux est la suivante : est-il même possible, en utilisant des méthodes statistiques, d’identifier au moins de manière fiable ces mêmes modèles afin de créer un classificateur formel qui distingue les commentateurs occasionnels des commentateurs professionnels ? Imaginez : « selon Habra-botometer, vous avez 76 % de chances d'être un Kremlinbot ». Ce sera bien plus cool que les raids karmiques les uns sur les autres.
Malheureusement, mes compétences ne suffisent même pas pour suggérer dans quelle direction creuser pour résoudre un tel problème. Cependant, hier soir, j'ai piraté un petit analyseur primitif qui (heureusement, les pages avec des commentaires sont ouvertes même aux visiteurs non autorisés) fait jusqu'à présent deux choses - a) collecte des statistiques à partir d'un nom d'utilisateur donné sur tous ses commentaires (pour l'instant juste un horodatage ) et l'ajoute à la base de données MySQL ; b) dessine un diagramme temporel en y marquant les événements d'envoi de commentaires extraits de cette base de données. Même sans aucune analyse sophistiquée, cela s’est avéré assez drôle. Voici à quoi ressemble mon tableau de commentaires. Les explications sont ci-dessous. Il est préférable de le visualiser dans une fenêtre séparée à une échelle de 100 % ou plus.

La ville s'endort, les habitants de Khabrovsk se réveillent

L'axe horizontal est le temps, chaque pixel est égal à une minute, la valeur des divisions grises est égale à une heure, toute la ligne horizontale est égale à un jour. Les jours vont de bas en haut le long de l'axe vertical, la valeur de division y est de 365 jours.

Il n'y a rien de particulièrement intéressant dans mon schéma. On peut voir que j'aime dormir 7 à 8 heures, me coucher souvent après minuit et faire parfois des marathons de commentaires de plusieurs heures, et que l'activité de l'année écoulée est supérieure ou approximativement égale à celle des cinq années précédentes. .
Ou voici un camarade gcube J'ai gardé un vœu de silence pendant trois ans et demi, et puis il a éclaté...

La ville s'endort, les habitants de Khabrovsk se réveillent

Le diagramme d'activité d'un commentateur habra typique ressemble à ceci (c'est QtRoS)

La ville s'endort, les habitants de Khabrovsk se réveillent

Un « creux endormi » distinct sur la gauche quelque part dans la nuit européenne et des commentaires tranquilles pendant la journée, peut-être avec des pauses pendant six mois.

Mais tous les diagrammes ne sont pas si ennuyeux ! Que diriez-vous de ceci, par exemple :

La ville s'endort, les habitants de Khabrovsk se réveillent

En un peu plus de deux ans, notre collègue a apparemment recyclé ses biorythmes pour dormir de la nuit européenne quelque part sous la dorsale médio-atlantique, de manière uniforme et progressive, puis a passé encore deux ans à retourner sur les côtes du Portugal. As-tu marché ? Nager? Je n'arrive pas à trouver des explications plausibles... Pendant les trois premières heures d'éveil, les commentaires volent comme une mitrailleuse, mais en fin de compte c'est comme ça, une fois toutes les heures je regarde ce qui se passe là et c'est tout.

D'ailleurs, c'était 0xd34df00d.

Et voici une autre énigme :

La ville s'endort, les habitants de Khabrovsk se réveillent

Le collègue est resté quatre ans et demi sans un seul commentaire - apparemment, il s'entraînait quelque part dans des monastères secrets sur la façon de rester éveillé pendant des jours, à en juger par le nombre de commentaires postés dans « Sleepy Hollow ».

Mais le plus intéressant ici est l'anomalie à la 16ème heure, qui dure plus de trois ans et disparaît progressivement au cours de la dernière année. Une pause cigarette? Promener le chien? Jogging? Qu'est-ce qui peut arracher un habitant de Khabrov au fil des commentaires au milieu d'une journée de travail avec une telle prédétermination quotidienne ? Je suis un plouc et un paresseux, je ne peux pas imaginer le genre d'autodiscipline que les respectés khim.

Enfin, un dernier schéma à méditer :

La ville s'endort, les habitants de Khabrovsk se réveillent

Il n’y a pas du tout de « creux endormi » clairement défini. Seul, on peut à peine discerner l'excédent visible du nombre de commentaires envoyés après midi par rapport à ceux envoyés avant.

Avec toute la rigueur du Komsomol, j'exhorte les respectés MTyrz désarmez-vous devant la fête et admettez honnêtement combien de grands-parents, de petites-filles, d'insectes et de souris gouvernent votre compte et écrivez des commentaires.

Et enfin, une question insidieuse : quelqu'un pourrait-il être tellement intéressé par tout cela qu'il voudrait développer le code de l'analyseur ou obtenir un vidage de la base de données ou y accéder, et ainsi de suite ? Ma propre connaissance des méthodes d’exploration de données et de visualisation de données ne dépasse guère l’érudition générale. Je ne peux guère penser à quelque chose de plus intelligent et de plus intéressant que ces simples diagrammes. Si quelqu'un est intéressé, écrivez-moi par télégramme (pseudo dans le profil).

Je vous remercie!

MISE À JOUR. Posté sources sur GitHub.

Source: habr.com

Ajouter un commentaire