Die stad raak aan die slaap, Khabrovsk-inwoners word wakker

As die aantal opmerkings onder 'n artikel vinnig 1000 nader, wees verseker dat ongeag die onderwerp wat deur die skrywer gestel word, 'n stryery binne woed: flitspunte van politiek, omring deur leunstoelkenners oor alle kwessies, psigiatriese diagnoses op 'n afstand deur avatar en bynaam, om persoonlike, sarkastiese aanvalle te kry, waarvan die bytheid dié van die bloed van xenomorfe oorskry, en natuurlik is die verpligte gereg in sulke gevalle wedersydse beskuldigings wat jou eweknie uitsluitlik vir vergoeding of uit plig met jou bespreek. Wat blykbaar gevaarlik en moeilik is, en met die eerste oogopslag blykbaar nie sigbaar is nie, en dertig silwerstukke lê nie op die pad nie.

Die snaakse ding van hierdie situasie is datdat mense wat diep deur die sindroom geraak word op-die-internet-is iemand-verkeerd, spandeer dikwels baie tyd en senuwees aan absoluut gratis bewys aan 'n ander ewe verbaasde persoon dat hy presies dieselfde doen vir geld of op bestelling. Soek jy logika hier? Sy is weg. Dis die internet, skat.

Kom ons neem een ​​van relatief vars kak oor beweerde territoriale diskriminasie op Gitlab. 4 dae het verloop sedert die publikasie van die artikel en natuurlik het die bespreking lankal ver wegbeweeg van die oorspronklik gestelde onderwerp. Die volgende frases klink:

'n Regte persoon sal niks teen 'n professionele kommentator op 'n intekening kan opponeer nie...

Gebruiker (so-en-so) spandeer 'n onrealistiese hoeveelheid tyd aan opmerkings ...
Boonop het sy aktiwiteit nie patrone wat gewoonlik kenmerkend is van 'n gewone gebruiker nie....

ps maar dit het my die idee gegee om 'n ontleder-ontleder vir sulke kommentators te skryf) Met 'n aanduiding van aktiwiteit per uur, hoeveelheid tyd per dag, per week, ens... 'n Goeie onderwerp vir 'n artikel)

Goed, stop. Watter soort patrone is "gewoonlik inherent aan die gemiddelde gebruiker"? Die skrywer van hierdie frase in daardie draad is ongelukkig reeds getranskribeer, so jy sal lukraak moet gaan.

Die vraag wat ek voor u duidelike oë wil stel, is die volgende: is dit selfs moontlik om, met behulp van statistiese metodes, hierdie selfde patrone ten minste betroubaar te identifiseer om 'n formele klassifiseerder te skep wat gemaklik en professionele kommentators onderskei? Stel jou voor - "volgens Habra-botometer is jy 76% waarskynlik 'n Kremlinbot." Dit sal baie koeler wees as karmiese strooptogte op mekaar.
Ongelukkig is my bevoegdhede nie genoeg om eens voor te stel watter rigting om in te grawe om so 'n probleem op te los nie. Ek het egter gisteraand 'n klein primitiewe ontleder saamgekap, wat (gelukkig is bladsye met opmerkings selfs oop vir ongemagtigde besoekers) tot dusver twee dinge doen - a) statistieke van 'n gegewe gebruikersnaam van al sy opmerkings insamel (vir nou net tydstempel ) en voeg dit by die MySQL-databasis; b) teken 'n tyddiagram, en merk daarop die gebeure van kommentaarversending wat uit hierdie databasis geneem is. Selfs sonder enige gesofistikeerde ontleding was dit nogal snaaks. Dit is hoe my kommentaarkaart lyk. Verduidelikings is hieronder. Dit is die beste om dit in 'n aparte venster op 'n skaal van 100% of meer te bekyk.

Die stad raak aan die slaap, Khabrovsk-inwoners word wakker

Die horisontale as is tyd, elke pixel is gelyk aan een minuut, die waarde van die grys afdelings is gelyk aan een uur, die hele horisontale lyn is gelyk aan een dag. Die dae gaan van onder na bo langs die vertikale as, die verdelingswaarde daarop is 365 dae.

Daar is niks besonders interessant in my diagram nie. Dit kan gesien word dat ek daarvan hou om 7-8 uur te slaap, dikwels na middernag te gaan slaap, en soms ure lange kommentaar-marathons het, en dat aktiwiteit die afgelope jaar groter as of ongeveer gelyk is aan dié oor die vorige vyf jaar .
Of hier is 'n kameraad gekubus Ek het drie en 'n half jaar lank 'n gelofte van stilte gehou, en toe breek dit deur...

Die stad raak aan die slaap, Khabrovsk-inwoners word wakker

Die aktiwiteitsdiagram van 'n tipiese habrakommentator lyk iets soos hierdie (dit is QtRoS)

Die stad raak aan die slaap, Khabrovsk-inwoners word wakker

’n Duidelike “slaperige holte” aan die linkerkant iewers in die Europese nag en rustige kommentaar gedurende dagligure, miskien met pouses vir ’n halfjaar.

Maar nie alle diagramme is so vervelig nie! Wat van hierdie, byvoorbeeld:

Die stad raak aan die slaap, Khabrovsk-inwoners word wakker

In net meer as twee jaar het ons kollega blykbaar sy bioritmes opgelei om van die Europese nag êrens onder die Mid-Atlantiese Ridge te slaap, eweredig en geleidelik, en toe nog twee jaar spandeer om terug te keer na die kus van Portugal. Het jy geloop? Swem? Ek kan nie met geloofwaardige verduidelikings vorendag kom nie... Vir die eerste drie ure van wakker wees vlieg kommentaar soos 'n masjiengeweer, maar op die ou einde van die dag is dit so, een keer elke uur kyk ek in om te sien wat aangaan daar en dit is dit.

Terloops, dit was 0xd34df00d.

En hier is nog 'n raaisel:

Die stad raak aan die slaap, Khabrovsk-inwoners word wakker

Die kollega het vier en 'n half jaar geduur sonder 'n enkele opmerking - blykbaar het hy iewers in geheime kloosters opgelei oor hoe om vir dae wakker te bly, te oordeel aan hoeveel opmerkings in "slaperige hol" geplaas is.

Maar die interessantste ding hier is die anomalie by die 16de uur, wat vir meer as drie jaar duur en geleidelik verdwyn in die laaste jaar. Rook breek? Stap met die hond? Draf? Wat anders kan 'n Khabrov-inwoner te midde van 'n werksdag met so 'n daaglikse voorafbepaling wegskeur van die kommentaarstroom? Ek is 'n slob en 'n lui mens, ek kan nie die soort selfdissipline voorstel wat die gerespekteerde kim.

Ten slotte, 'n laaste diagram om oor na te dink:

Die stad raak aan die slaap, Khabrovsk-inwoners word wakker

Daar is glad nie 'n duidelik gedefinieerde "slaperige holte" daarop nie. Slegs 'n mens kan skaars die sigbare oormaat in die aantal kommentaar wat ná die middaguur gestuur word, oor dié wat voorheen gestuur is, onderskei.

Met alle Komsomol strengheid dring ek by die gerespekteerdes MTyrz ontwapen jouself voor die partytjie en erken eerlik hoeveel grootouers, kleindogters, goggas en muise jou rekening regeer en kommentaar skryf.

En laastens, 'n verraderlike vraag - kan iemand so in dit alles belangstel dat hulle die ontlederkode wil ontwikkel of 'n databasisstorting of toegang daartoe wil kry, ensovoorts? My eie kennis van data-ontginning en datavisualiseringsmetodes oortref skaars algemene geleerdheid. Ek kan skaars aan iets slimmer en interessanter dink as hierdie eenvoudige diagramme. As iemand belangstel, skryf vir my in telegram (bynaam in profiel).

Skep 'n nuwe weergawe!

UPD. Het dit geplaas bronne op GitHub.

Bron: will.com

Voeg 'n opmerking