Um sérkenni hagtölfræðinnar

Ég hef áður tekið eftir undarlegri hegðun í einkunnagjöf, en nýlega hefur undarleikinn orðið of augljós. Og ég ákvað að rannsaka vandamálið með því að nota þær vísindalegu aðferðir sem mér standa til boða, nefnilega: að greina gangverkið plús-mínus. Ímyndaðirðu þér allt í einu?

Ég er enn forritari, en ég get gert mjög einfalda hluti. Svo ég kóðaði einfalt tól sem safnar tölfræði frá spjaldunum í Khabrov færslunni: kostir, gallar, skoðanir, bókamerki osfrv.

Um sérkenni hagtölfræðinnar

Tölfræðin er sýnd í línuritum, eftir að hafa rannsakað það gátum við uppgötvað nokkra óvænta, smærri. En fyrst og fremst.

Undarlegt 1.
Þetta er þar sem tölfræðilegar rannsóknir mínar hófust í raun.

Mér þótti undarlegt að fyrstu klukkustundirnar eftir birtingu sumra innlegga minna urðu þær verulega neikvæðar, fóru síðan í núll og fengu að lokum væntanlegt plús. Hvers vegna gerðist það?

Ég var einmitt að fara að birta aðra færslu - í tveimur hlutum. Ég ákvað að láta hann fara í tölfræðilega greiningu.

Birti fyrri hlutann. Á sama tíma ræsti ég tólið og fór að bíða eftir niðurstöðunni. Því miður, á nóttunni - meðan ég svaf - hætti forritið að safna upplýsingum vegna galla. Morguninn eftir leiðrétti ég villuna en tölfræðin reyndist vera innan við sólarhring. Hins vegar eru þróunin einnig augljós fyrir þann tíma sem unnið er.

Gögnin eru veitt fyrstu 14 klukkustundirnar frá birtingu, bilið á milli mælinga er 10 mínútur.

Um sérkenni hagtölfræðinnar

Augun blekktu okkur ekki: Flestir gallarnir eiga sér stað á fyrstu klukkustund færslunnar. Fyrst fór færslan á neikvætt svæði, svo jafnaði hún sig. Hér eru tölurnar sem notaðar eru til að teikna línuritið:

Um sérkenni hagtölfræðinnar

Og það þrátt fyrir að áhorf aukist hnökralaust!

Um sérkenni hagtölfræðinnar

Skrefin sem byrja á þúsundasta gildum eru útskýrð af því að skammstafanir byrja í Khabrov spjaldinu: það er hvergi hægt að fá nákvæman fjölda skoðana (líklega hefði það getað verið tekið frá þjónustu þriðja aðila, en ég notaði þær ekki ).

Ég er ekki sérfræðingur í tölfræði, en slík dreifing á mínus er óeðlileg, eftir því sem ég skil?!

Sko, bókamerkin dreifast meira og minna jafnt yfir skráningartímabilið:

Um sérkenni hagtölfræðinnar

Athugasemdum er einnig dreift jafnt:

Um sérkenni hagtölfræðinnar

Það eru sprengingar af virkni og aðgerðaleysi, en þau dreifast líka yfir tímabilið: athugasemdir ýmist dofna eða halda áfram.

Sama með áskrifendur - það er samræmd lítilsháttar aukning:

Um sérkenni hagtölfræðinnar

Karma breyttist ekki á skýrslutímabilinu - ég er ekki að vitna í það. Og einkunnin er reiknuð út af Habr, það þýðir ekkert að telja það upp.

Allir vísbendingar breytast í hlutfalli við fjölda áhorfa og aðeins með mínusunum er eitthvað rangt: reiðikastið á sér stað á fyrstu klukkustundinni frá upphafi útgáfu. Það sama gerðist með fyrri færslur mínar. En ef fyrr voru þetta, ef svo má segja, persónulegar birtingar, nú eru þær staðfestar með skráningu.

Að mínu hreinu noob mati þýðir slík dreifing: það eru nokkrir notendur á síðunni sem skoða markvisst nýjustu birtu færslurnar og kjósa sum færslurnar niður - byggt á þörf sem þeir þekkja. Ég skrifa "sumar færslurnar" vegna þess að ég tók eftir þessum áhrifum ekki aðeins í ritum mínum. Í öllum tilfellum eru áhrifin áberandi, annars hefði ég einfaldlega ekki veitt því athygli.

Ég hef fjórar útgáfur af því hvers vegna þetta gerist.

Útgáfa 1. Andleg pervera. Sjúkt fólk vakir vísvitandi yfir höfundum sem þeim finnst óþægilegt og kveður þá niður, með það að markmiði að skaða þá.

Ég trúi ekki á þessa útgáfu.

Útgáfa 2. Sálfræðileg áhrif. Hver - ég veit það ekki. Jæja, hvers vegna taka lesendur fyrst samhljóða mínus færsluna, síðan ekki síður einróma með henni? Eru þeir mínus sem ekki þema, en plús eftir fegurðarkunnáttumenn finna sig í meirihluta? Ég veit ekki.

Ef það eru sálfræðingar á meðal lesenda, láttu þá segja sitt.

Útgáfa 3. Þjónarnir eru að bregðast við. Af hverju ættu yfirmenn þeirra að dreifa rotnum á póstum Khabrovs? Guð veit það. Hins vegar eru þjónustumenn ekki aðeins í okkar landi. Hver mun skilja þá, Russophobes?!

Útgáfa 4. Samsett áhrif áðurnefndra þátta.

Alveg hægt að hugsa sér.

Hvað sem því líður, þá tekst mínusum að fækka áhorfum. Ég þekki ekki reglurnar um að koma færslum Khabrov á toppinn, ég veit ekki einu sinni hvort þessi reiknirit hafa verið birt opinberlega eða ekki, en það er augljóst fyrir mér: snemma mínus leyfir ekki útskúfuðum færslum að ná toppnum - nánar tiltekið, það tefur að komast þangað, sem aftur á móti dregur verulega úr fjölda áhorfa.

Eftir því sem ég skil þá eru engar árangursríkar leiðir til að berjast gegn þessari illsku. Eina leiðin er persónukjör. Aðeins í þessu tilfelli geturðu ákvarðað hvaða snið eru reglulega að rekja og að frádregnum nýjustu færslum. Hins vegar er engin persónuleg atkvæðagreiðsla um Habré (eða réttara sagt, hún er ekki gerð opinber).

En það er ekki svo einfalt.

Eins og ég sagði var krufin efni birt í köflum. Eftir birtingu seinni hlutans bjóst ég við svipaðri mynd: með upphafsúttakinu í mínus og síðari í plús. Hins vegar reyndust áhrifin vera mun jafnari: færslan breyttist ekki í mínus.

Þegar seinni hlutinn var birtur hafði villan verið lagfærð, svo gögnin eru gefin upp á dag:

Um sérkenni hagtölfræðinnar

Ég veit ekki hvaðan sléttunin kom. Kannski vegna þess að það var birt á laugardegi (niðuratkvæði virka ekki á laugardögum?) eða vegna þess að þetta er endir á áður birtu efni.

Hins vegar er dreifing mínus enn ójöfn: allir mínusar eiga sér stað á fyrri hluta skráningartímabilsins og mínus lýkur mun fyrr en plús. Á sama tíma dreifast áhorf á tímabilið nákvæmlega eins og síðast - jafnt:

Um sérkenni hagtölfræðinnar

Gróðurinn sem varð um þrjú leytið síðdegis er ekki trúnaðarefni. Netið mitt slokknaði bara í klukkutíma. Tækið gat ekki tengst síðunni.

Um sérkenni hagtölfræðinnar

Allt annað er algjörlega staðlað.

Bókamerki:

Um sérkenni hagtölfræðinnar

Athugasemdir: eins og síðast skiptast á hreyfingar og þögn.

Um sérkenni hagtölfræðinnar

Karma. Aukning um nokkrar einingar var skráð - auðvitað ekki samtímis:

Um sérkenni hagtölfræðinnar

Og áskrifendur. Heildarfjöldinn hélst óbreyttur (að því er virðist hafa áhugasamir skráð sig þegar fyrsti hlutinn var birtur). Rétt um eitt leytið eftir hádegi var ein sveifla: einhver hætti áskrift - kannski fyrir mistök - en skráði sig strax aftur. Ef það var annar aðili, áttu sér stað bætur: heildarfjöldi áskrifenda breyttist ekki.

Um sérkenni hagtölfræðinnar

Svo, póstmælingar hegða sér á skýran og fyrirsjáanlegan hátt. Allir vísbendingar, nema gallarnir. Þar sem ég sé enga augljósa ástæðu fyrir þessu finnst mér mínus toppurinn að minnsta kosti skrítinn.

Undarlegt 2.
Stundum fækkar áhorfum (sem er auðvitað ómögulegt) en fer fljótlega í eðlilegt horf.

Ég rakti það fyrir tilviljun, við villuleit í forritinu, þegar útflutnings-innflutningsaðgerðin hafði ekki enn verið tengd, þannig að samsvarandi sikksakk vantar á línuritið. Þú mátt taka orð mín fyrir það - þessi áhrif sáust tvisvar. Nokkur þúsund áhorf, skyndilega fækkar áhorfunum um nokkur hundruð, eftir 10-20 mínútur er það aftur komið á fyrra horf (án þess að taka tillit til náttúrulegrar aukningar).

Þetta er frekar einfalt: villa á síðunni. Og það er ekkert að hugsa um.

Undarlegt 3.
Þetta er það sem mér fannst miklu undarlegra en sjálfviljug fyrstu og tæknilegu seinni áhrifin. Plúsar gerast ekki einir, með jafnri dreifingu yfir tímabilið, heldur í blokkum. En að bæta við er ekki athugasemd, þegar spurning er eðlilega fylgt eftir með svari eru þau einstaklingsbundin athöfn!

Skoðaðu niðurstöðuritin sem birt eru hér að ofan: kubbarnir eru áberandi.

Fróðir menn kinkuðu kolli til mín varðandi Poisson dreifinguna, en ég get ekki reiknað út líkurnar sjálfur. Ef þú getur, gerðu stærðfræðina. Mér er þegar ljóst að fjöldi tvöfaldra plúsa er langt umfram normið.

Hér eru stafræn gögn um kosti fyrri hluta færslunnar. Línuritið sýnir fjölda plúsa fyrir staka, tvöfalda og þrefalda stöðu í heildarfjölda einkunna. Eins og fyrr segir er mælingarbilið 10 mínútur.

Um sérkenni hagtölfræðinnar

Af 30 stungum í 84 hólf var stungið í tvær hólf þrisvar sinnum. Jæja, ég veit ekki hversu mikið þetta samsvarar líkindafræði...

Gögn fyrir seinni hluta færslunnar (þar sem mælitíminn er lengri stytti ég hann í samræmi við lengd fyrri hlutans, til samanburðar):

Um sérkenni hagtölfræðinnar

Við the vegur, hér er einn af stökum plúsunum við hlið hinnar þrefalda í tíma, það er að segja á um 20 mínútum varð aukning í plúsum (29% af heildarfjölda þeirra voru plúsar). Og þetta gerðist ekki á fyrstu mínútum útgáfunnar.

Sambandið á milli einnar, tvöfaldrar og þrefaldrar stöðu er nokkurn veginn það sama og í fyrri hlutanum. Og lækkun á hlutdeild einkunna í mælingum skýrist af því að einkunnir voru sjaldnar gefnar. Mælingar voru gerðar en engir kostir voru skráðir.

Ég get ekki útskýrt þessa blokk plús áhrif á nokkurn hátt, það er, alls ekki. Fyrir ókosti virðist slík „stíflað“ hegðun ekki vera dæmigerð.

Senda útsendarar góðvildar tillögur í lotum, kveikt og slökkt? Hehehehe...

PS
Ef einhver vill greina tölfræði pósta með því að nota fullkomnari aðferðir eða athuga reikninginn, þá eru skrárnar með upprunagögnunum hér:
yadi.sk/d/iN4SL6tzsGEQxw

Ég heimta ekki efasemdir mínar - kannski hef ég rangt fyrir mér, sérstaklega þar sem tölfræðin er dökk. Ég vona að athugasemdir frá faglegum tölfræðingum, sálfræðingum og öðrum áhugasömum notendum skýri þann rugling sem hefur skapast.

Þakka þér fyrir athygli þína.

Heimild: www.habr.com

Bæta við athugasemd