Linn jääb magama, habrovilased ärkavad

Kui artikli all olevate kommentaaride arv läheneb kiiresti 1000-le, võite olla kindlad, et olenemata autori poolt välja toodud teemast käib sees tüli: poliitika sähvatuspunktid, ümbritsetud tugitooliekspertidest kõigis küsimustes, psühhiaatrilised diagnoosid distantsilt avatari saatel. ja hüüdnimi, isiklike, sarkastiliste rünnakute saamine, mille kaust ületab ksenomorfide vere oma, ja loomulikult on sellistel puhkudel kohustuslik roog vastastikused süüdistused, mida teie kolleeg teiega ainult tasu pärast või kohusetundest arutab. Mis ilmselt on ohtlik ja raske ning esmapilgul ei paistagi silma ning kolmkümmend hõbetükki ei leba tee peal.

Selle olukorra naljakas on seeet sündroomist sügavalt mõjutatud inimesed Internetis-keegi-eksib, kulutavad sageli kuradima palju aega ja närve täiesti tasuta tõesta teisele sama hämmastunud inimesele, et tema teeb täpselt sama asja raha eest või tellimuse peale. Kas otsite siin loogikat? Ta on läinud. See on internet, kallis.

Võtame ühe suhteliselt värske pask väidetava territoriaalse diskrimineerimise kohta Gitlabis. Artikli ilmumisest on möödas 4 päeva ja loomulikult on arutelu algselt välja öeldud teemast ammu kaugele eemaldunud. Kõlavad järgmised fraasid:

Päris inimene ei saa tellimisel professionaalsele kommentaatorile midagi vastu panna...

Kasutaja (nii ja nii) kulutab kommentaaridele ebareaalselt palju aega...
Pealegi pole selle tegevusel tavakasutajale tavaliselt omaseid mustreid....

ps aga see andis mulle idee kirjutada sellistele kommenteerijatele parser-analüsaator) Näidates aktiivsust tundide kaupa, aega päevas, nädalas jne... Hea teema artikli jaoks)

Olgu, lõpeta. Millised mustrid on "tavaliselt omased tavakasutajale"? Selle lõime selle fraasi autor on kahjuks juba transkribeeritud, nii et peate valima juhuslikult.

Küsimus, mille tahan teie selgete silmade ette esitada, on järgmine: kas statistiliste meetodite abil on üldse võimalik neid samu mustreid vähemalt usaldusväärselt tuvastada, et luua formaalne klassifikaator, mis eristab juhuslikke kommentaatoreid professionaalsetest kommentaatoritest? Kujutage ette - "Habra-botomeetri järgi olete 76% tõenäosusega Kremli robot." See on palju lahedam kui üksteisele suunatud karmarünnakud.
Kahjuks ei piisa minu kompetentsidest, et isegi soovitada, millises suunas sellise probleemi lahendamiseks süveneda. Küll aga häkkisin eile õhtul kokku väikese primitiivse parseri, mis (õnneks on kommentaaridega lehed avatud ka volitamata külastajatele) teeb seni kahte asja - a) kogub antud kasutajanime järgi statistikat kõigi tema kommentaaride kohta (praegu lihtsalt ajatempel - ) ja lisab selle MySQL andmebaasi; b) joonistab ajadiagrammi, märkides sellele sellest andmebaasist võetud kommentaaride saatmise sündmused. Isegi ilma keeruka analüüsita osutus see üsna naljakaks. Selline näeb välja minu kommentaaride tabel. Selgitused on allpool. Parim on vaadata seda eraldi aknas skaalal 100% või rohkem.

Linn jääb magama, habrovilased ärkavad

Horisontaalne telg on aeg, iga piksel on võrdne ühe minutiga, hallide osade väärtus on võrdne ühe tunniga, kogu horisontaaljoon on võrdne ühe päevaga. Päevad lähevad mööda vertikaaltelge alt üles, jagamise väärtus sellel on 365 päeva.

Minu diagrammil pole midagi eriti huvitavat. On näha, et mulle meeldib magada 7-8 tundi, sageli lähen magama pärast südaööd ja vahel on tundidepikkused kommenteerimismaratonid ning see aktiivsus on viimase aasta jooksul suurem või ligikaudu võrdne viimase viie aasta omaga. .
Või siin on seltsimees gecube Pidasin kolm ja pool aastat vaikimisvannet ja siis läks see läbi...

Linn jääb magama, habrovilased ärkavad

Tüüpilise habrakommentaatori tegevusskeem näeb välja umbes selline (see on QtRoS)

Linn jääb magama, habrovilased ärkavad

Selge “uneõõs” vasakul kuskil euroopa öös ja rahulik kommentaar valgel ajal, võib-olla pooleaastase vaheajaga.

Kuid mitte kõik diagrammid pole nii igavad! Kuidas oleks näiteks sellega:

Linn jääb magama, habrovilased ärkavad

Veidi enam kui kahe aastaga treenis meie kolleeg ilmselt ühtlaselt ja järk-järgult oma biorütme ümber Euroopa ööst kusagil Kesk-Atlandi seljandiku all magama ja veetis siis veel kaks aastat, et Portugali kallastele naasta. Kas sa kõndisid? Ujuda? Ma ei oska usutavaid selgitusi välja mõelda... Esimesed kolm ärkveloleku tundi lendavad kommentaarid nagu kuulipildujast, aga päeva lõpuks on nii, et iga tund vaatan korra sisse, et mis toimub seal ja kõik.

Muide, oligi 0xd34df00d.

Ja siin on veel üks mõistatus:

Linn jääb magama, habrovilased ärkavad

Kolleeg pidas vastu neli ja pool aastat ühegi kommentaarita – ilmselt treenis ta kuskil salakloostrites, kuidas pärast seda päevade kaupa ärkvel püsida, otsustades selle järgi, kui palju kommentaare “unesõõnes” postitati.

Kuid kõige huvitavam on siin 16. tunni anomaalia, mis kestab üle kolme aasta ja taandub viimase aastaga järk-järgult. Suitsupaus? Jalutan koeraga? Jooksmine? Mis muu suudab sellise igapäevase ettemääratusega Habrovi elaniku keset tööpäeva kommentaarisöödast lahti rebida? Olen lörts ja laisk inimene, ma ei kujuta ette sellist enesedistsipliini, mida austatud khim.

Lõpuks veel üks diagramm, mille üle mõelda:

Linn jääb magama, habrovilased ärkavad

Selgelt määratletud "unine lohk" pole sellel üldse. Vaid vaevu võib märgata, et pärast keskpäeva saadetud kommentaaride arv ületab varem saadetud kommentaare.

Kogu komsomoli rangusega kutsun üles lugupeetud Mtyrz desarmeeri end peo ees ja tunnista ausalt, kui paljud vanavanemad, lapselapsed, lollakad ja hiired valitsevad sinu kontot ja kirjutavad kommentaare.

Ja lõpetuseks üks salakaval küsimus - kas keegi võiks sellest kõigest nii huvitatud olla, et tahaks arendada parser koodi või saada andmebaasi dump või ligipääs sellele jne? Minu enda teadmised andmekaeve ja andmete visualiseerimise meetoditest ei ületa vaevalt üldist eruditsiooni. Vaevalt ma suudan neist lihtsatest diagrammidest midagi targemat ja huvitavamat välja mõelda. Kui kellelgi on huvi, siis kirjutage mulle telegrammi (hüüdnimi profiilis).

Tänan teid tähelepanu eest!

UPD. Postitas selle allikad GitHubis.

Allikas: www.habr.com

Lisa kommentaar