Die Stadt schläft ein, die Bewohner von Chabrowsk wachen auf

Wenn die Anzahl der Kommentare unter einem Artikel schnell auf 1000 zusteuert, können Sie sicher sein, dass unabhängig vom vom Autor angegebenen Thema ein Streit im Inneren tobt: Krisenherde der Politik, umgeben von Sesselexperten zu allen Themen, psychiatrische Diagnosen aus der Ferne per Avatar und Spitzname, persönliche, sarkastische Angriffe bekommen, deren Schärfe die des Blutes von Xenomorphen übertrifft, und das obligatorische Gericht in solchen Fällen sind natürlich gegenseitige Anschuldigungen, die Ihr Gegenüber nur gegen Bezahlung oder aus Pflichtgefühl mit Ihnen bespricht. Was offenbar gefährlich und schwierig ist und auf den ersten Blick nicht sichtbar zu sein scheint und dreißig Silberlinge nicht auf der Straße liegen.

Das Lustige an dieser Situation ist dasdass Menschen stark von dem Syndrom betroffen sind Im Internet liegt jemand falsch, oft verdammt viel Zeit und Nerven darauf verwenden völlig kostenlos Beweisen Sie einer anderen ebenso erstaunten Person, dass sie genau das Gleiche tut gegen Geld oder auf Bestellung. Suchen Sie hier nach Logik? Sie ist gegangen. Es ist das Internet, Baby.

Nehmen wir eines davon relativ frische Scheiße über angebliche territoriale Diskriminierung auf Gitlab. Seit der Veröffentlichung des Artikels sind 4 Tage vergangen und natürlich hat sich die Diskussion längst weit vom ursprünglich genannten Thema entfernt. Die folgenden Sätze klingen:

Ein echter Mensch wird einem professionellen Kommentator im Abonnement nichts entgegensetzen können...

Der Benutzer (so und so) verbringt unrealistisch viel Zeit mit Kommentaren ...
Darüber hinaus weist seine Aktivität keine Muster auf, die normalerweise für einen normalen Benutzer charakteristisch sind....

PS, aber das brachte mich auf die Idee, einen Parser-Analysator für solche Kommentatoren zu schreiben) Mit einer Angabe der Aktivität pro Stunde, der Zeit pro Tag, pro Woche usw. ... Ein gutes Thema für einen Artikel)

Okay, hör auf. Welche Muster sind „normalerweise dem durchschnittlichen Benutzer innewohnend“? Der Autor dieses Satzes in diesem Thread wurde leider bereits transkribiert, Sie müssen also nach dem Zufallsprinzip suchen.

Die Frage, die ich vor Ihre klaren Augen stellen möchte, ist folgende: Ist es mit statistischen Methoden überhaupt möglich, diese Muster zumindest zuverlässig zu identifizieren, um einen formalen Klassifikator zu erstellen, der Gelegenheitskommentatoren von professionellen Kommentatoren unterscheidet? Stellen Sie sich vor: „Laut Habra-Botometer sind Sie mit einer Wahrscheinlichkeit von 76 % ein Kremlbot.“ Das wird viel cooler sein als karmische Überfälle aufeinander.
Leider reichen meine Kompetenzen nicht aus, um auch nur einen Vorschlag zu machen, in welche Richtung man zur Lösung eines solchen Problems vorgehen sollte. Gestern Abend habe ich jedoch einen kleinen, primitiven Parser zusammengehackt, der (glücklicherweise sind Seiten mit Kommentaren auch für unbefugte Besucher geöffnet) bisher zwei Dinge tut: a) von einem bestimmten Benutzernamen Statistiken über alle seine Kommentare sammelt (vorerst nur Zeitstempel). ) und fügt es der MySQL-Datenbank hinzu; b) erstellt ein Zeitdiagramm und markiert darauf die Ereignisse des Kommentarversands aus dieser Datenbank. Auch ohne ausgefeilte Analyse erwies es sich als ziemlich lustig. So sieht mein Kommentardiagramm aus. Erläuterungen finden Sie weiter unten. Am besten betrachten Sie es in einem separaten Fenster mit einem Maßstab von 100 % oder mehr.

Die Stadt schläft ein, die Bewohner von Chabrowsk wachen auf

Die horizontale Achse ist die Zeit, jedes Pixel entspricht einer Minute, der Wert der Graustufen entspricht einer Stunde, die gesamte horizontale Linie entspricht einem Tag. Die Tage verlaufen von unten nach oben entlang der vertikalen Achse, der Teilungswert beträgt 365 Tage.

In meinem Diagramm gibt es nichts besonders Interessantes. Es zeigt sich, dass ich gerne 7-8 Stunden schlafe, oft nach Mitternacht zu Bett gehe und manchmal stundenlange Kommentierungsmarathons absolviere und dass die Aktivität im letzten Jahr größer oder ungefähr gleich hoch wie in den fünf Jahren zuvor ist .
Oder hier ist ein Kamerad Gewürfel Ich habe dreieinhalb Jahre lang ein Schweigegelübde gehalten, und dann ist es durchgebrochen ...

Die Stadt schläft ein, die Bewohner von Chabrowsk wachen auf

Das Aktivitätsdiagramm eines typischen Habra-Kommentators sieht in etwa so aus (dies ist QtRoS)

Die Stadt schläft ein, die Bewohner von Chabrowsk wachen auf

Eine deutliche „verschlafene Mulde“ links irgendwo in der europäischen Nacht und gemächlicher Kommentar bei Tageslicht, vielleicht mit Pausen für ein halbes Jahr.

Aber nicht alle Diagramme sind so langweilig! Wie wäre es zum Beispiel damit:

Die Stadt schläft ein, die Bewohner von Chabrowsk wachen auf

In etwas mehr als zwei Jahren hat unser Kollege offenbar seinen Biorhythmus gleichmäßig und schrittweise auf den Schlaf aus der europäischen Nacht irgendwo unter dem Mittelatlantischen Rücken umgestellt und verbrachte dann weitere zwei Jahre damit, an die Küsten Portugals zurückzukehren. Bist du gelaufen? Schwimmen? Mir fallen keine plausiblen Erklärungen ein ... Die ersten drei Stunden im Wachzustand fliegen Kommentare wie ein Maschinengewehr, aber am Ende des Tages ist es so, einmal in der Stunde schaue ich rein, um zu sehen, was los ist da und das wars.

Das war es übrigens 0xd34df00d.

Und hier ist noch ein Rätsel:

Die Stadt schläft ein, die Bewohner von Chabrowsk wachen auf

Der Kollege blieb viereinhalb Jahre ohne einen einzigen Kommentar übrig – offenbar trainierte er irgendwo in geheimen Klöstern, wie man danach tagelang wach bleibt, gemessen an der Anzahl der Kommentare, die in „Sleepy Hollow“ gepostet wurden.

Das Interessanteste hier ist jedoch die Anomalie in der 16. Stunde, die mehr als drei Jahre anhält und im letzten Jahr allmählich verschwindet. Raucherpause? Gassi gehen? Joggen? Was sonst kann einen Chabrow-Bewohner mitten in einem Arbeitstag mit solch einer täglichen Vorherbestimmung aus dem Kommentar-Feed herausreißen? Ich bin ein Faulpelz und ein fauler Mensch, ich kann mir die Art von Selbstdisziplin, die der respektierte Mensch an den Tag legt, nicht vorstellen Khim.

Abschließend noch ein letztes Diagramm zum Nachdenken:

Die Stadt schläft ein, die Bewohner von Chabrowsk wachen auf

Es gibt überhaupt keine klar definierte „verschlafene Mulde“. Man kann nur kaum erkennen, dass die Anzahl der nach Mittag gesendeten Kommentare im Vergleich zu den zuvor gesendeten Kommentaren deutlich höher ist.

Mit aller Komsomol-Strenge fordere ich die Verehrten auf MTyrz Entwaffnen Sie sich vor der Party und geben Sie ehrlich zu, wie viele Großeltern, Enkelinnen, Käfer und Mäuse Ihren Account beherrschen und Kommentare schreiben.

Und zum Schluss noch eine heimtückische Frage: Könnte jemand an all dem so interessiert sein, dass er den Parser-Code entwickeln oder einen Datenbank-Dump oder Zugriff darauf usw. erhalten möchte? Meine eigenen Kenntnisse über Data-Mining- und Datenvisualisierungsmethoden gehen kaum über die allgemeine Gelehrsamkeit hinaus. Ich kann mir kaum etwas Intelligenteres und Interessanteres vorstellen als diese einfachen Diagramme. Wenn jemand Interesse hat, schreiben Sie mir per Telegramm (Spitzname im Profil).

Danke!

UPD. Hat es geposted Quellen auf GitHub.

Source: habr.com

Kommentar hinzufügen