A város elalszik, a habrovszkiak felébrednek

Ha egy cikk alatti kommentek száma rohamosan megközelíti az 1000-et, nyugodj meg, hogy a szerző által felvetett témától függetlenül zsivaj dúl odabent: a politika villanáspontjai, minden kérdésben fotelszakértőkkel körülvéve, pszichiátriai diagnózisok távolról avatárral. és becenév, személyes, szarkasztikus támadások szerzése, melyek marósága meghaladja az xenomorfok vérét, és persze ilyenkor kötelező fogás a kölcsönös vádaskodás, amiről társad kizárólag díjazásból vagy kötelességből tárgyal veled. Ami láthatóan veszélyes és nehéz, és első pillantásra nem is látszik, és harminc ezüst nem hever az úton.

Ebben a helyzetben az a vicceshogy a szindróma által mélyen érintett emberek az interneten-valaki-téved, gyakran rohadt sok időt és ideget töltenek azzal teljesen ingyenes bizonyítsd be egy másik ugyanolyan csodálkozó embernek, hogy ő pontosan ugyanazt csinálja pénzért vagy megrendelésre. Logikát keresel itt? Elment. Ez az internet, bébi.

Vegyünk egyet viszonylag friss szar a Gitlab állítólagos területi diszkriminációjáról. 4 nap telt el a cikk megjelenése óta és persze a vita már régen eltávolodott az eredetileg megfogalmazott témától. A következő mondatok hangzanak el:

Valódi ember nem tud semmi ellentmondani egy előfizetéses szakkommentátornak...

A felhasználó (ilyen-olyan) irreálisan sok időt tölt a megjegyzésekkel...
Sőt, tevékenysége nem rendelkezik olyan mintákkal, amelyek általában egy hétköznapi felhasználóra jellemzőek....

p.s. de ez adta az ötletet, hogy írjak egy elemző-elemzőt az ilyen kommentelőknek) Óra szerinti tevékenység, napi, heti idő stb. jelzésével... Jó téma egy cikkhez)

Oké, állj meg. És milyen minták jellemzőek „általában egy hétköznapi felhasználóra”? Ennek a szálnak a szerzőjét sajnos már átírták, így véletlenszerűen kell mennie.

A kérdés, amelyet tiszta szemei ​​elé szeretnék állítani, a következő: egyáltalán lehetséges-e statisztikai módszerekkel legalább megbízhatóan azonosítani ugyanezeket a mintákat, hogy olyan formális osztályozót hozzunk létre, amely megkülönbözteti a hétköznapi és a professzionális kommentátorokat? Képzeld el – „a Habra-botométer szerint 76%-os valószínűséggel kremlbot vagy.” Ez sokkal menőbb lesz, mint az egymás elleni karmikus razziák.
Sajnos az én kompetenciáim nem elégségesek ahhoz, hogy javasoljak egy ilyen probléma megoldásának irányát. Tegnap este azonban összetörtem egy kis primitív elemzőt, ami (szerencsére a kommenteket tartalmazó oldalak még illetéktelen látogatók előtt is nyitva állnak) eddig két dolgot csinál - a) egy adott felhasználónévből gyűjti a statisztikát az összes hozzászólásáról (egyelőre csak időbélyegző) ), és hozzáadja a MySQL adatbázishoz; b) idődiagramot rajzol, amelyen megjelöli az ebből az adatbázisból vett hozzászólásküldés eseményeit. Még minden kifinomult elemzés nélkül is elég viccesnek bizonyult. Így néz ki a megjegyzéstáblázatom. A magyarázatok alább találhatók. A legjobb, ha egy külön ablakban tekinti meg, legalább 100%-os léptékben.

A város elalszik, a habrovszkiak felébrednek

A vízszintes tengely az idő, minden pixel egyenlő egy perccel, a szürke osztás értéke egy óra, a teljes vízszintes vonal egyenlő egy nappal. A napok alulról felfelé haladnak a függőleges tengely mentén, a felosztási ár rajta 365 nap.

A diagramomban nincs semmi különösebben érdekes. Látható, hogy szeretek 7-8 órát aludni, gyakran éjfél után fekszem le, és néha órákig tartó kommentelő maratonokat tartok, és az elmúlt egy év aktivitása nagyobb vagy megközelítőleg megegyezik az előző öt év aktivitásával. .
Vagy itt van egy elvtárs gecube Három és fél évig hallgatási fogadalmat tettem, aztán megtört...

A város elalszik, a habrovszkiak felébrednek

Egy tipikus habrakommentátor tevékenységdiagramja valahogy így néz ki (ez az QtRoS)

A város elalszik, a habrovszkiak felébrednek

Különleges „álmos üreg” a bal oldalon valahol az európai éjszakában, és laza kommentár a nappali órákban, esetleg fél éves szünetekkel.

De nem minden diagram ilyen unalmas! Mit szólnál ehhez például:

A város elalszik, a habrovszkiak felébrednek

Alig több mint két év alatt kollégánk láthatóan átképezte bioritmusát, hogy az európai éjszakából valahol a Közép-Atlanti-hátság alatt egyenletesen és fokozatosan aludjon, majd újabb két évet töltött azzal, hogy visszatérjen Portugália partjaira. Sétáltál? Úszás? Nem tudok elfogadható magyarázatokat kitalálni... Az ébrenlét első három órájában géppuskaként repülnek a kommentek, de a nap végén úgy van, hogy óránként egyszer benézek, hogy mi a helyzet. ott és ennyi.

Mellesleg az volt 0xd34df00d.

És itt van még egy rejtvény:

A város elalszik, a habrovszkiak felébrednek

A kolléga négy és fél évig bírta egyetlen megjegyzés nélkül – láthatóan valahol titkos kolostorokban képezte ki, hogyan kell napokig ébren maradni, abból ítélve, hogy hány megjegyzést tettek közzé az „álmos üregben”.

De a legérdekesebb itt a 16. óra anomália, amely több mint három évig tart, és az utolsó évben fokozatosan elmúlik. Füstszünet? Kutyát sétáltatni? Kocogás? Mi más téphet el egy habrov-lakót a kommentároktól egy munkanap közepette ilyen napi előre elhatározással? nyavalyás és lusta ember vagyok, nem tudom elképzelni azt a fajta önfegyelmet, mint a tisztelt khim.

Végül egy utolsó diagram, amelyre érdemes gondolni:

A város elalszik, a habrovszkiak felébrednek

Egyáltalán nincs rajta egyértelműen meghatározott „álmos üreg”. A dél után küldött hozzászólások számában alig lehet észrevenni, hogy a korábban elküldöttekhez képest mekkora többlet.

Komszomoli szigorral kérem a tisztelt Mtyrz fegyverezd le magad a buli előtt, és valld be őszintén, hogy mennyi nagyszülő, unoka, bogár és egér uralkodik a fiókodon, és írj kommenteket.

És végül egy alattomos kérdés - lehet, hogy valakit annyira érdekel ez az egész, hogy ki akarja fejleszteni az elemző kódot, vagy adatbázis-kiíratást szerezni, vagy hozzáférést kapni hozzá, stb? Saját tudásom az adatbányászatról és az adatvizualizációs módszerekről alig haladja meg az általános műveltséget. Aligha tudok okosabbat és érdekesebbet elképzelni ezeknél az egyszerű diagramoknál. Ha valakit érdekel írjon táviratban (becenév a profilban).

Спасибо за внимание!

UPD. közzétette források a GitHubon.

Forrás: will.com

Hozzászólás