Kaupunki nukahtaa, Habrovskin asukkaat heräävät

Jos artikkelin alla olevien kommenttien määrä lähestyy nopeasti 1000:aa, voit olla varma, että kirjoittajan mainitsemasta aiheesta riippumatta sisällä raivoaa riita: politiikan leimahduspisteitä, nojatuoliasiantuntijoiden ympäröimänä kaikista asioista, psykiatriset diagnoosit etäältä avatarilla. ja lempinimi, henkilökohtaisten, sarkastisten hyökkäysten saaminen, joiden kaustisuus ylittää ksenomorfien veren, ja tietysti pakollinen ruokalaji sellaisissa tapauksissa on molemminpuoliset syytökset, joista vastineesi keskustelee kanssasi vain palkasta tai velvollisuudesta. Mikä ilmeisesti on vaarallista ja vaikeaa, ja ensi silmäyksellä ei näytä olevan näkyvissä, ja kolmekymmentä hopeapalaa ei makaa tiellä.

Hauskinta tässä tilanteessa on seettä oireyhtymään syvästi vaikuttaneet ihmiset Internetissä-joku-on-väärässä, viettää usein pirun paljon aikaa ja hermoja täysin ilmainen todistaa toiselle yhtä hämmästyneelle henkilölle, että hän tekee täsmälleen saman asian rahalla tai tilauksesta. Etsitkö logiikkaa tästä? Hän on poissa. Se on Internet, kulta.

Otetaan yksi niistä suhteellisen tuoretta paskaa väitetystä alueellisesta syrjinnästä Gitlabissa. 4 päivää on kulunut artikkelin julkaisusta ja keskustelu on tietysti jo kauan sitten siirtynyt kauas alunperin sanotusta aiheesta. Seuraavat lauseet kuulostavat:

Todellinen henkilö ei voi vastustaa mitään tilauksen ammattikommentaattorille...

Käyttäjä (niin ja niin) käyttää epärealistisen paljon aikaa kommentteihin...
Lisäksi sen toiminnassa ei ole tavalliselle käyttäjälle tyypillisiä malleja....

p.s. mutta tästä sain idean kirjoittaa jäsennysanalysaattori sellaisille kommentoijille) Ilmoitetaan aktiivisuus tunneittain, aika päivässä, viikossa jne... Hyvä aihe artikkelille)

Okei, lopeta. Ja millaiset mallit ovat "yleensä tyypillisiä tavalliselle käyttäjälle"? Tämän säikeen lauseen kirjoittaja on valitettavasti jo litteroitu, joten sinun on valittava satunnaisesti.

Kysymys, jonka haluan esittää selkeiden silmiesi eteen, on seuraava: onko edes mahdollista tilastollisia menetelmiä käyttäen tunnistaa ainakin luotettavasti nämä samat mallit, jotta saadaan aikaan muodollinen luokitin, joka erottaa satunnaiset ja ammattikommentaattorit? Kuvittele - "Habra-botometrin mukaan olet 76% todennäköisyydellä Kremlinbot." Tämä on paljon siistimpää kuin karmiset hyökkäykset toisiaan vastaan.
Valitettavasti pätevyyteni ei riitä edes ehdottamaan, mihin suuntaan tällaisen ongelman ratkaisemiseksi pitäisi kaivaa. Eilen illalla hakkeroin kuitenkin yhteen pienen primitiivisen jäsentimen, joka (onneksi kommenttisivut ovat avoimia myös luvattomille vierailijoille) tekee toistaiseksi kaksi asiaa - a) kerää tilastot tietystä käyttäjätunnuksesta kaikista kommenteistaan ​​(toistaiseksi vain aikaleima ) ja lisää sen MySQL-tietokantaan; b) piirtää aikakaavion, johon merkitään tästä tietokannasta poimitut kommenttien lähettämisen tapahtumat. Jopa ilman hienostunutta analyysiä se osoittautui melko hauskaksi. Tältä kommenttikaavioni näyttää. Selitykset ovat alla. On parasta tarkastella sitä erillisessä ikkunassa vähintään 100 %:n mittakaavassa.

Kaupunki nukahtaa, Habrovskin asukkaat heräävät

Vaaka-akseli on aika, jokainen pikseli on yhtä suuri kuin yksi minuutti, harmaan jakojen arvo on yksi tunti, koko vaakaviiva on yhtä suuri kuin yksi päivä. Päivät kulkevat pystyakselia pitkin alhaalta ylös, jakohinta sillä on 365 päivää.

Kaaviossani ei ole mitään erityisen kiinnostavaa. On nähtävissä, että nukun 7-8 tuntia, menen usein nukkumaan puolenyön jälkeen ja joskus minulla on tuntikausia kommentointimaratoneja, ja että aktiivisuus viimeisen vuoden aikana on suurempi tai suunnilleen yhtä suuri kuin viimeisen viiden vuoden aikana. .
Tai tässä on toveri gecube Pidin hiljaisuuden lupauksen kolme ja puoli vuotta, ja sitten se meni läpi...

Kaupunki nukahtaa, Habrovskin asukkaat heräävät

Tyypillisen habrakommentaattorin aktiivisuuskaavio näyttää suunnilleen tältä (tämä on QtRoS)

Kaupunki nukahtaa, Habrovskin asukkaat heräävät

Selkeä "uninen ontelo" vasemmalla jossain Euroopan yössä ja leppoisaa kommentointia päivänvalossa, ehkä puolen vuoden tauoilla.

Mutta kaikki kaaviot eivät ole niin tylsiä! Entä esimerkiksi tämä:

Kaupunki nukahtaa, Habrovskin asukkaat heräävät

Hieman yli kahdessa vuodessa kollegamme ilmeisesti koulutti biorytminsä uudelleen nukkumaan Euroopan yöstä jossain Keski-Atlantin harjanteen alla, tasaisesti ja vähitellen, ja vietti sitten vielä kaksi vuotta palatakseen Portugalin rannoille. Kävelitkö? Uida? En osaa keksiä uskottavia selityksiä... Kolmen ensimmäisen tunnin valveilla kommentit lentävät kuin konekivääri, mutta loppujen lopuksi se on niin, kerran tunnissa katson sisään mitä siellä tapahtuu. siellä ja siinä se.

Oli muuten 0xd34df00d.

Ja tässä vielä yksi arvoitus:

Kaupunki nukahtaa, Habrovskin asukkaat heräävät

Kollegani kesti neljä ja puoli vuotta ilman ainuttakaan kommenttia – ilmeisesti hän harjoitteli jossain salaisissa luostareissa pysyä hereillä päiväkausia, päätellen kuinka monta kommenttia oli lähetetty "uninen onto".

Mutta mielenkiintoisin asia tässä on 16. tunnin poikkeama, joka kestää yli kolme vuotta ja häviää vähitellen viimeisen vuoden aikana. Tupakka tauko? Kävelyttää koiraa? Lenkkeily? Mikä muu voi repiä Khabrov-asuvan irti kommenttisyötteestä keskellä työpäivää sellaisella päivittäisellä määrätietoisuudella? Olen laiska ja laiska ihminen, en voi kuvitella sellaista itsekuria kuin arvostetut khim.

Lopuksi vielä yksi kaavio pohdittavaksi:

Kaupunki nukahtaa, Habrovskin asukkaat heräävät

Siinä ei ole lainkaan selkeästi määriteltyä "uninen ontto". Vain yksi voi tuskin erottaa näkyvää ylimäärää puolenpäivän jälkeen lähetettyjen kommenttien määrässä aiemmin lähetettyihin verrattuna.

Kaikella komsomolin ankaruudella kehotan arvostettuja Mtyrz riisu itsesi aseista juhlien edessä ja myönnä rehellisesti, kuinka monet isovanhemmat, tyttärentytäret, ötökät ja hiiret hallitsevat tiliäsi ja kirjoittaa kommentteja.

Ja lopuksi salakavala kysymys - voisiko joku olla niin kiinnostunut tästä kaikesta, että hän haluaisi kehittää jäsennyskoodia tai saada tietokannan kaatopaikan tai pääsyn siihen ja niin edelleen? Oma tietoni tiedon louhinnasta ja datan visualisointimenetelmistä tuskin ylittää yleisen erudition. Tuskin voi kuvitella mitään älykkäämpää ja kiinnostavampaa kuin nämä yksinkertaiset kaaviot. Jos jotakuta kiinnostaa, kirjoita minulle sähkeeseen (lempinimi profiilissa).

Спасибо за внимание!

UPD. Lähetti sen lähteet GitHubissa.

Lähde: will.com

Lisää kommentti