La ciutat s'adorm, els habitants de Khabrovsk es desperten

Si el nombre de comentaris sota un article s'acosta ràpidament als 1000, tingueu la seguretat que, independentment del tema indicat per l'autor, hi ha una baralla a l'interior: punts d'inflexió de la política, envoltats d'experts en butaques en tots els temes, diagnòstics psiquiàtrics a distància per avatar. i el sobrenom, rebre atacs personals i sarcàstics, la causticitat dels quals supera la de la sang dels xenomorfs, i, per descomptat, el plat obligatori en aquests casos són les acusacions mútues que el teu homòleg està discutint amb tu únicament per remuneració o per deure. La qual cosa, pel que sembla, és perillós i difícil, i a primera vista sembla que no es veu, i trenta peces de plata no hi ha a la carretera.

El més curiós d'aquesta situació és aixòque les persones profundament afectades per la síndrome a-Internet-algú-s'equivoca, sovint hi passen molt de temps i nervis absolutament gratuït demostrar a una altra persona igualment meravellada que està fent exactament el mateix per diners o per encàrrec. Esteu buscant la lògica aquí? Ella se n'ha anat. És Internet, nena.

Agafem-ne un merda relativament fresca sobre presumptes discriminacions territorials a Gitlab. Han passat 4 dies des de la publicació de l'article i, per descomptat, la discussió fa temps que s'ha allunyat molt del tema plantejat inicialment. Sonen les frases següents:

Una persona real no podrà oposar res a un comentarista professional en una subscripció...

L'usuari (fulano) dedica una quantitat de temps poc realista als comentaris...
A més, la seva activitat no té patrons que solen ser característics d'un usuari normal....

p.s. però això em va donar la idea d'escriure un analitzador analitzador per a aquests comentaristes) Amb una indicació d'activitat per hora, quantitat de temps per dia, per setmana, etc... Un bon tema per a un article)

D'acord, para. I quin tipus de patrons són "normalment inherents a l'usuari mitjà"? L'autor d'aquesta frase en aquell fil, malauradament, ja s'ha transcrit, així que haureu d'anar a l'atzar.

La pregunta que vull plantejar als vostres ulls clars és la següent: és possible fins i tot, utilitzant mètodes estadístics, identificar, almenys de manera fiable, aquests mateixos patrons per crear un classificador formal que distingeixi els comentaristes casuals dels professionals? Imagineu-vos: "segons Habra-botòmetre, teniu un 76% de probabilitats de ser un Kremlinbot". Això serà molt més genial que les incursions kàrmiques entre si.
Malauradament, les meves competències no són suficients per ni tan sols suggerir quina direcció em dirigir per resoldre aquest problema. No obstant això, ahir a la nit vaig piratejar un petit analitzador primitiu, que (afortunadament les pàgines amb comentaris estan obertes fins i tot a visitants no autoritzats) fins ara fa dues coses: a) recopila estadístiques d'un nom d'usuari determinat de tots els seus comentaris (per ara només el segell de temps). ) i l'afegeix a la base de dades MySQL; b) dibuixa un diagrama de temps, marcant-hi els esdeveniments d'enviament de comentaris extrets d'aquesta base de dades. Fins i tot sense cap anàlisi sofisticada, va resultar bastant divertit. Així és el meu gràfic de comentaris. Les explicacions són a continuació. El millor és veure'l en una finestra independent a una escala del 100% o més.

La ciutat s'adorm, els habitants de Khabrovsk es desperten

L'eix horitzontal és el temps, cada píxel és igual a un minut, el valor de les divisions grises és igual a una hora, tota la línia horitzontal és igual a un dia. Els dies van de baix a dalt al llarg de l'eix vertical, el valor de la divisió és de 365 dies.

No hi ha res especialment interessant al meu diagrama. Es pot veure que m'agrada dormir de 7 a 8 hores, sovint anar al llit després de la mitjanit i, de vegades, tinc maratons de comentaris d'hores de durada, i que l'activitat durant l'últim any és superior o aproximadament igual a la dels cinc anys anteriors. .
O aquí hi ha un company gecube Vaig mantenir un vot de silenci durant tres anys i mig, i després es va trencar...

La ciutat s'adorm, els habitants de Khabrovsk es desperten

El diagrama d'activitats d'un habracomentador típic s'assembla a això (això és QtRoS)

La ciutat s'adorm, els habitants de Khabrovsk es desperten

Un distint "buit adormit" a l'esquerra en algun lloc de la nit europea i comentaris pausats durant les hores del dia, potser amb pauses durant mig any.

Però no tots els diagrames són tan avorrits! Què tal això, per exemple:

La ciutat s'adorm, els habitants de Khabrovsk es desperten

En poc més de dos anys, sembla que el nostre col·lega va tornar a entrenar els seus bioritmes per dormir de la nit europea en algun lloc sota la dorsal atlàntica mitjana, de manera uniforme i gradual, i després va passar dos anys més per tornar a les costes de Portugal. Vas caminar? Nedar? No puc trobar explicacions versemblants... Durant les tres primeres hores d'estar despert, els comentaris volen com una metralladora, però al final del dia és així, un cop cada hora miro a veure què passa. allà i ja està.

Per cert, ho era 0xd34df00d.

I aquí hi ha un altre enigma:

La ciutat s'adorm, els habitants de Khabrovsk es desperten

El col·lega va durar quatre anys i mig sense cap comentari: pel que sembla, s'estava entrenant en algun lloc de monestirs secrets sobre com mantenir-se despert durant dies, a jutjar pels comentaris publicats a "sleepy hollow".

Però el més interessant aquí és l'anomalia a l'hora 16, que dura més de tres anys i s'esvaeix progressivament en l'últim any. Pausa de fum? Passejant el gos? Trotar? Què més pot allunyar un resident de Khabrov del canal de comentaris enmig d'una jornada laboral amb tanta predeterminació diària? Sóc una persona mandrosa i mandrosa, no m'imagino el tipus d'autodisciplina que el respectat khim.

Finalment, un últim diagrama per pensar:

La ciutat s'adorm, els habitants de Khabrovsk es desperten

No hi ha un "buit adormit" clarament definit. Només un pot discernir l'excés visible en el nombre de comentaris enviats després del migdia respecte als enviats abans.

Amb tot el rigor Komsomol, insto els respectats MTyrz desarmar-se davant la festa i admetre sincerament quants avis, nétes, bitxos i ratolins governen el teu compte i escriu comentaris.

I, finalment, una pregunta insidiosa: algú podria estar tan interessat en tot això que voldria desenvolupar el codi de l'analitzador o obtenir un abocament de la base de dades o accedir-hi, etc. El meu propi coneixement sobre la mineria de dades i els mètodes de visualització de dades amb prou feines supera l'erudició general. Difícilment puc pensar en res més intel·ligent i interessant que aquests simples diagrames. Si algú està interessat, escriu-me a telegrama (àlies al perfil).

Gràcies!

UPD. Ho va publicar fonts a GitHub.

Font: www.habr.com

Afegeix comentari