Mesto zaspi, prebivalci Habrovska se prebudijo

Če se število komentarjev pod člankom hitro približuje 1000, bodite prepričani, da ne glede na temo, ki jo navaja avtor, v notranjosti divja prepir: žarišča politike, obkrožena s foteljskimi strokovnjaki za vsa vprašanja, psihiatrične diagnoze na daljavo z avatarjem. in vzdevek, pridobivanje osebnih, sarkastičnih napadov, katerih jedkost presega kri ksenomorfov, seveda pa je obvezna jed v takšnih primerih medsebojno obtoževanje, o katerem sogovornik razpravlja s tabo zgolj za plačilo ali iz dolžnosti. Kar je na videz nevarno in težko in se na prvi pogled zdi, da ni vidno, trideset srebrnikov pa ne leži na cesti.

Smešno pri tej situaciji je, dada ljudje, ki jih je sindrom močno prizadel na-internetu-se-nekdo-moti, pogosto porabijo presneto veliko časa in živcev za povsem brezplačno dokazati drugi enako začudeni osebi, da počne popolnoma isto stvar za denar ali po naročilu. Iščete logiko tukaj? Ona je šla. To je internet, srček.

Vzemimo enega od relativno sveže sranje o domnevni teritorialni diskriminaciji na Gitlabu. Minili so 4 dnevi od objave članka in seveda se je razprava že zdavnaj odmaknila od prvotno zastavljene teme. Zvenijo naslednje fraze:

Strokovnemu komentatorju na abonmaju pravi človek ne bo mogel ničesar nasprotovati...

Uporabnik (ta in ta) porabi nerealno veliko časa za komentarje...
Poleg tega njegova dejavnost nima vzorcev, ki so običajno značilni za navadnega uporabnika....

p.s. toda to mi je dalo idejo, da napišem razčlenjevalnik-analizator za take komentatorje) Z navedbo aktivnosti po urah, količini časa na dan, na teden itd... Dobra tema za članek)

V redu, nehaj. Kakšni vzorci so »običajno lastni povprečnemu uporabniku«? Avtor tega izraza v tej temi je na žalost že prepisan, tako da boste morali iti naključno.

Vprašanje, ki ga želim postaviti pred vaše bistre oči, je naslednje: ali je s statističnimi metodami sploh mogoče te iste vzorce vsaj zanesljivo identificirati, da bi ustvarili formalni klasifikator, ki loči priložnostne od profesionalnih komentatorjev? Predstavljajte si - "po Habra-botometru obstaja 76% verjetnost, da ste Kremlinbot." To bo veliko bolj kul kot karmični napadi drug na drugega.
Žal moje kompetence ne zadoščajo, da bi sploh predlagal, v katero smer se je treba lotiti reševanja takšnega problema. Sinoči pa sem skupaj vdrl v majhen primitivni razčlenjevalnik, ki (na srečo so strani s komentarji odprte tudi nepooblaščenim obiskovalcem) zaenkrat dela dvoje - a) zbira statistiko od danega uporabniškega imena vseh njegovih komentarjev (zaenkrat samo time -stamp ) in ga doda v bazo podatkov MySQL; b) nariše časovni diagram in na njem označi dogodke pošiljanja komentarjev, vzete iz te baze podatkov. Tudi brez prefinjene analize je izpadlo precej smešno. Tako izgleda moj grafikon komentarjev. Pojasnila so spodaj. Najbolje je, da si ga ogledate v ločenem oknu v merilu 100 % ali več.

Mesto zaspi, prebivalci Habrovska se prebudijo

Vodoravna os je čas, vsak piksel je enak eni minuti, vrednost sivih razdelkov je enaka eni uri, celotna vodoravna črta je enaka enemu dnevu. Dnevi gredo od spodaj navzgor vzdolž navpične osi, vrednost delitve na njej je 365 dni.

V mojem diagramu ni nič posebej zanimivega. Vidi se, da rad spim 7-8 ur, velikokrat grem spat po polnoči, včasih imam večurne komentirajoče maratone in da je aktivnost v zadnjem letu večja ali približno enaka tistim v preteklih petih letih. .
Ali pa tukaj je tovariš gecube Tri leta in pol sem se držal zaobljube molka, potem pa se je prelomilo ...

Mesto zaspi, prebivalci Habrovska se prebudijo

Diagram dejavnosti tipičnega habrakomentatorja izgleda nekako takole (to je QtRoS)

Mesto zaspi, prebivalci Habrovska se prebudijo

Izrazita »zaspana kotanja« na levi nekje v evropski noči in ležerno komentiranje podnevi, morda s prekinitvami za pol leta.

Vendar niso vsi diagrami tako dolgočasni! Kaj pa to na primer:

Mesto zaspi, prebivalci Habrovska se prebudijo

V dobrih dveh letih je naš kolega očitno enakomerno in postopoma prekvalificiral svoj bioritem za spanje iz evropske noči nekje pod Srednoatlantskim grebenom, nato pa porabil še dve leti za vrnitev na obale Portugalske. Ste hodili? plavati? Ne morem najti verjetnih razlag... Prve tri ure budnosti komentarji letijo kot mitraljez, na koncu dneva pa je tako, enkrat na uro pogledam noter, kaj se dogaja. tam in to je to.

Mimogrede, bilo je 0xd34df00d.

In tukaj je še ena uganka:

Mesto zaspi, prebivalci Habrovska se prebudijo

Kolega je zdržal štiri leta in pol brez enega samega komentarja - očitno se je nekje v skrivnih samostanih uril, kako ostati buden več dni, sodeč po tem, koliko komentarjev je bilo objavljenih v "Sleepy Hollow".

Najbolj zanimiva pri tem pa je anomalija na 16. uri, ki traja več kot tri leta in v zadnjem letu postopoma izzveni. Premor za dim? Sprehajanje psa? Tek? Kaj še lahko odtrga prebivalca Khabrova od vira komentarjev sredi delovnega dne s tako vsakodnevno predodločenostjo? Sem lenuh in lenuh, ne morem si predstavljati vrste samodiscipline, ki jo spoštovani khim.

Za konec še zadnji diagram za razmislek:

Mesto zaspi, prebivalci Habrovska se prebudijo

Na njem sploh ni jasno definirane "zaspane kotline". Le komaj je mogoče razbrati viden presežek števila komentarjev, poslanih po poldnevu, nad tistimi, ki so bili poslani prej.

Z vso komsomolsko strogostjo pozivam spoštovane MTyrz razoroži se pred stranko in si pošteno priznaj koliko dedkov, babic, vnukinj, hroščkov in mišk vlada na tvojem računu in piši komentarje.

In za konec še eno zahrbtno vprašanje - ali bi lahko koga vse to tako zanimalo, da bi želel razviti kodo razčlenjevalnika ali pridobiti izpis podatkovne baze ali dostop do nje itd.? Moje lastno znanje o metodah podatkovnega rudarjenja in vizualizacije podatkov komajda presega splošno erudicijo. Težko se mi zdi kaj pametnejšega in zanimivejšega od teh preprostih diagramov. Če koga zanima naj mi piše v telegram (nickname v profilu).

Спасибо за внимание!

UPD. Objavil viri na GitHubu.

Vir: www.habr.com

Dodaj komentar