De stêd falt yn 'e sliep, Khabrovites wurde wekker

As it oantal opmerkingen ûnder in artikel rap nei 1000 komt, wês der wis fan dat, nettsjinsteande it ûnderwerp dat troch de auteur oanjûn is, in skeel fan binnen raast: flitspunten fan polityk, omjûn troch leunstoel-eksperts oer alle saken, psychiatryske diagnoaze op in ôfstân troch avatar en bynamme, getting persoanlike, sarcastic oanfallen, de causticity fan dat grutter is as dy fan it bloed fan xenomorphs, en, fansels, de ferplichte skûtel yn sokke gefallen is ûnderlinge beskuldigings dy't jo tsjinhinger besprekt mei jo allinnich foar beleanning of út plicht. Wat, blykber, gefaarlik en dreech is, en op it earste each net sichtber liket te wêzen, en tritich sulveren lizze net op 'e dyk.

It grappige ding oer dizze situaasje is datdat minsken djip beynfloede troch it syndroom op-it-ynternet-is-ien-mis, faak besteegje in damn soad tiid en senuwen oan absolút fergees bewize oan in oare like fernuvere persoan dat er krekt itselde docht foar jild of op bestelling. Sykje jo hjir logika? Sy is fuort. It is ynternet, poppe.

Lit ús nimme ien fan relatyf frisse stront oer sabeare territoriale diskriminaasje op Gitlab. 4 dagen binne ferrûn sûnt de publikaasje fan it artikel en, fansels, de diskusje is lang ferhuze fier fuort fan it oarspronklik oantsjutte ûnderwerp. De folgjende útdrukkingen klinke:

In echte persoan sil neat kinne fersette tsjin in profesjonele kommentator op in abonnemint ...

Brûker (sa-en-sa) besteget in ûnrealistyske tiid oan opmerkings ...
Boppedat hat syn aktiviteit gjin patroanen dy't normaal karakteristyk binne foar in gewoane brûker....

p.s. mar dit joech my it idee om in parser-analyzer te skriuwen foar sokke kommentators) Mei in yndikaasje fan aktiviteit per oere, hoemannichte tiid per dei, per wike, ensfh ... In goed ûnderwerp foar in artikel)

Okee, stopje. Hokker soarte fan patroanen binne "meastentiids ynherint oan 'e gemiddelde brûker"? De skriuwer fan dizze sin yn dat tried is spitigernôch al transkribearre, dus jo moatte willekeurich gean.

De fraach dy't ik foar jo dúdlike eagen stelle wol is de folgjende: is it sels mooglik, mei statistyske metoaden, op syn minst betrouber deselde patroanen te identifisearjen om sa in formele klassifikaasje te meitsjen dy't casual fan profesjonele kommentators ûnderskiedt? Stel jo foar - "neffens Habra-botometer binne jo 76% wierskynlik in Kremlinbot." Dit sil folle koeler wêze as karmyske oerfallen op elkoar.
Spitigernôch binne myn kompetinsjes net genôch om sels foar te stellen hokker rjochting te graven is om sa'n probleem op te lossen. Dochs ha ik justerjûn in lytse primitive parser gearhacke, dy't (gelokkich binne siden mei opmerkings iepen sels foar net-autorisearre besikers) oant no ta twa dingen docht - a) statistiken sammelet fan in opjûne brûkersnamme fan al syn opmerkingen (foar no gewoan tiidstempel ) en foeget it ta oan de MySQL-database; b) tekenet in tiiddiagram, en markearret dêrop de eveneminten fan it ferstjoeren fan opmerkings út dizze databank. Sels sûnder sofistike analyze waard it frij grappich. Dit is hoe't myn kommentaarkaart derút sjocht. Taljochtingen binne hjirûnder. It is it bêste om it yn in apart finster te besjen op in skaal fan 100% of mear.

De stêd falt yn 'e sliep, Khabrovites wurde wekker

De horizontale as is tiid, elke piksel is gelyk oan ien minút, de wearde fan 'e grize divyzjes ​​is gelyk oan ien oere, de hiele horizontale line is gelyk oan ien dei. De dagen geane fan ûnderen nei boppen lâns de fertikale as, de divyzjewearde derop is 365 dagen.

D'r is neat spesjaal ynteressant yn myn diagram. It kin sjoen wurde dat ik graach 7-8 oeren sliepe, faaks nei middernacht op bêd gean, en soms oerenlange marathons foar kommentaar haw, en dat aktiviteit yn it ôfrûne jier grutter is as of sawat gelyk oan dy oer de foargeande fiif jier .
Of hjir is in kammeraat gecube Ik hâldde trije en in heal jier in gelofte fan stilte, en doe bruts it troch...

De stêd falt yn 'e sliep, Khabrovites wurde wekker

It aktiviteitsdiagram fan in typyske habracommentator sjocht der sa út (dit is QtRoS)

De stêd falt yn 'e sliep, Khabrovites wurde wekker

In dúdlik "slieperige holte" oan de linkerkant earne yn de Europeeske nacht en rêstich kommentaar oer deiljocht, miskien mei in healjier pauzes.

Mar net alle diagrammen binne sa saai! Hoe sit it mei dit, bygelyks:

De stêd falt yn 'e sliep, Khabrovites wurde wekker

Yn krekt mear as twa jier hat ús kollega blykber syn biorhythmen opnij traine om te sliepen fan 'e Jeropeeske nacht earne ûnder de Mid-Atlantyske Ridge, lykwichtich en stadichoan, en hat doe noch twa jier trochbrocht om werom te gean nei de kusten fan Portugal. Hast rûn? Swimme? Ik kin gjin plausibele útlis komme... De earste trije oeren fan wekker fleane de opmerkings as in mitrailleur, mar oan de ein fan de dei is it sa, ik sjoch ien kear yn it oere nei wat der bart dêr en dat is it.

Troch de wei, it wie 0xd34df00d.

En hjir is noch in riedsel:

De stêd falt yn 'e sliep, Khabrovites wurde wekker

De kollega duorre fjouwer en in heal jier sûnder ien inkelde opmerking - blykber trainde hy earne yn geheime kleasters oer hoe't er dagenlang wekker bliuwe koe, te beoardieljen nei hoefolle opmerkingen waarden pleatst yn "slieperige holle."

Mar it meast nijsgjirrige ding hjir is de anomaly op 'e 16e oere, dy't mear as trije jier duorret en yn it lêste jier stadichoan ferdwynt. Smoke break? De hûn útlitte? Joggen? Wat oars kin in ynwenner fan Khabrov fuort skuorre fan 'e opmerkingsfeed yn' e midden fan in wurkdei mei sa'n deistige foarbestimming? Ik bin in slop en in lui persoan, ik kin my net yntinke hokker soarte fan selsdissipline dat de respekteare khim.

As lêste, ien lêste diagram om oer te tinken:

De stêd falt yn 'e sliep, Khabrovites wurde wekker

Der is hielendal gjin dúdlik definiearre "sleepy hol" op. Allinne men kin amper ûnderskiede it sichtbere oerskot yn it oantal opmerkings ferstjoerd nei de middei oer dyjingen ferstjoerd earder.

Mei alle Komsomol strangens ik dring oan by de respektearre MTyrz ûntwapenje josels foar de partij en jou earlik ta hoefolle pake en beppe, pakesizzers, bugs en mûzen jo akkount regearje en opmerkings skriuwe.

En as lêste, in ferrifeljende fraach - koe immen sa ynteressearre wêze yn dit alles dat se de parserkoade ûntwikkelje wolle of in database-dump krije of tagong ta it, ensafuorthinne? Myn eigen kennis fan data mining en data fisualisaasje metoaden is amper grutter as de algemiene erudysje. Ik kin amper tinke oan wat tûker en nijsgjirriger dan dizze ienfâldige diagrammen. As immen ynteressearre is, skriuw dan nei my yn telegram (bynamme yn profyl).

Спасибо за внимание!

UPD. Pleatst it boarnen op GitHub.

Boarne: www.habr.com

Add a comment