Če se število komentarjev pod člankom hitro približuje 1000, bodite prepričani, da ne glede na temo, ki jo navaja avtor, v notranjosti divja prepir: žarišča politike, obkrožena s foteljskimi strokovnjaki za vsa vprašanja, psihiatrične diagnoze na daljavo z avatarjem. in vzdevek, pridobivanje osebnih, sarkastičnih napadov, katerih jedkost presega kri ksenomorfov, seveda pa je obvezna jed v takšnih primerih medsebojno obtoževanje, o katerem sogovornik razpravlja s tabo zgolj za plačilo ali iz dolžnosti. Kar je na videz nevarno in težko in se na prvi pogled zdi, da ni vidno, trideset srebrnikov pa ne leži na cesti.
Smešno pri tej situaciji je, da
Vzemimo enega od
Strokovnemu komentatorju na abonmaju pravi človek ne bo mogel ničesar nasprotovati...
Uporabnik (ta in ta) porabi nerealno veliko časa za komentarje...
Poleg tega njegova dejavnost nima vzorcev, ki so običajno značilni za navadnega uporabnika....p.s. toda to mi je dalo idejo, da napišem razčlenjevalnik-analizator za take komentatorje) Z navedbo aktivnosti po urah, količini časa na dan, na teden itd... Dobra tema za članek)
V redu, nehaj. Kakšni vzorci so »običajno lastni povprečnemu uporabniku«? Avtor tega izraza v tej temi je na žalost že prepisan, tako da boste morali iti naključno.
Vprašanje, ki ga želim postaviti pred vaše bistre oči, je naslednje: ali je s statističnimi metodami sploh mogoče te iste vzorce vsaj zanesljivo identificirati, da bi ustvarili formalni klasifikator, ki loči priložnostne od profesionalnih komentatorjev? Predstavljajte si - "po Habra-botometru obstaja 76% verjetnost, da ste Kremlinbot." To bo veliko bolj kul kot karmični napadi drug na drugega.
Žal moje kompetence ne zadoščajo, da bi sploh predlagal, v katero smer se je treba lotiti reševanja takšnega problema. Sinoči pa sem skupaj vdrl v majhen primitivni razčlenjevalnik, ki (na srečo so strani s komentarji odprte tudi nepooblaščenim obiskovalcem) zaenkrat dela dvoje - a) zbira statistiko od danega uporabniškega imena vseh njegovih komentarjev (zaenkrat samo time -stamp ) in ga doda v bazo podatkov MySQL; b) nariše časovni diagram in na njem označi dogodke pošiljanja komentarjev, vzete iz te baze podatkov. Tudi brez prefinjene analize je izpadlo precej smešno. Tako izgleda moj grafikon komentarjev. Pojasnila so spodaj. Najbolje je, da si ga ogledate v ločenem oknu v merilu 100 % ali več.
Vodoravna os je čas, vsak piksel je enak eni minuti, vrednost sivih razdelkov je enaka eni uri, celotna vodoravna črta je enaka enemu dnevu. Dnevi gredo od spodaj navzgor vzdolž navpične osi, vrednost delitve na njej je 365 dni.
V mojem diagramu ni nič posebej zanimivega. Vidi se, da rad spim 7-8 ur, velikokrat grem spat po polnoči, včasih imam večurne komentirajoče maratone in da je aktivnost v zadnjem letu večja ali približno enaka tistim v preteklih petih letih. .
Ali pa tukaj je tovariš
Diagram dejavnosti tipičnega habrakomentatorja izgleda nekako takole (to je
Izrazita »zaspana kotanja« na levi nekje v evropski noči in ležerno komentiranje podnevi, morda s prekinitvami za pol leta.
Vendar niso vsi diagrami tako dolgočasni! Kaj pa to na primer:
V dobrih dveh letih je naš kolega očitno enakomerno in postopoma prekvalificiral svoj bioritem za spanje iz evropske noči nekje pod Srednoatlantskim grebenom, nato pa porabil še dve leti za vrnitev na obale Portugalske. Ste hodili? plavati? Ne morem najti verjetnih razlag... Prve tri ure budnosti komentarji letijo kot mitraljez, na koncu dneva pa je tako, enkrat na uro pogledam noter, kaj se dogaja. tam in to je to.
Mimogrede, bilo je
In tukaj je še ena uganka:
Kolega je zdržal štiri leta in pol brez enega samega komentarja - očitno se je nekje v skrivnih samostanih uril, kako ostati buden več dni, sodeč po tem, koliko komentarjev je bilo objavljenih v "Sleepy Hollow".
Najbolj zanimiva pri tem pa je anomalija na 16. uri, ki traja več kot tri leta in v zadnjem letu postopoma izzveni. Premor za dim? Sprehajanje psa? Tek? Kaj še lahko odtrga prebivalca Khabrova od vira komentarjev sredi delovnega dne s tako vsakodnevno predodločenostjo? Sem lenuh in lenuh, ne morem si predstavljati vrste samodiscipline, ki jo spoštovani
Za konec še zadnji diagram za razmislek:
Na njem sploh ni jasno definirane "zaspane kotline". Le komaj je mogoče razbrati viden presežek števila komentarjev, poslanih po poldnevu, nad tistimi, ki so bili poslani prej.
Z vso komsomolsko strogostjo pozivam spoštovane
In za konec še eno zahrbtno vprašanje - ali bi lahko koga vse to tako zanimalo, da bi želel razviti kodo razčlenjevalnika ali pridobiti izpis podatkovne baze ali dostop do nje itd.? Moje lastno znanje o metodah podatkovnega rudarjenja in vizualizacije podatkov komajda presega splošno erudicijo. Težko se mi zdi kaj pametnejšega in zanimivejšega od teh preprostih diagramov. Če koga zanima naj mi piše v telegram (nickname v profilu).
Спасибо за внимание!
UPD. Objavil
Vir: www.habr.com