O nenavadnostih habrostatistike

Že prej sem opazil nenavadno vedenje v ocenah, a v zadnjem času je postalo nenavadnost preveč očitna. In odločil sem se, da raziščem problem z znanstvenimi metodami, ki so mi na voljo, in sicer: analiziram dinamiko plus-minus. Ste se nenadoma zamislili?

Še vedno sem programer, vendar znam narediti zelo osnovne stvari. Zato sem kodiral preprost pripomoček, ki zbira statistične podatke iz plošč objave Khabrov: prednosti, slabosti, ogledi, zaznamki itd.

O nenavadnostih habrostatistike

Statistika je prikazana v grafih, po preučevanju katerih smo lahko odkrili še nekaj presenečenj, manjših. Ampak najprej.

Nenavadnost 1.
Tu se je pravzaprav začelo moje statistično raziskovanje.

Zdelo se mi je nenavadno, da so v prvih urah po objavi nekaterih mojih objav močno padle v minus, nato pa na ničlo in na koncu zaslužile pričakovan plus. Zakaj se je to zgodilo?

Ravno sem nameravala objaviti še eno objavo - v dveh delih. Odločil sem se, da ga podvržem statistični analizi.

Objavljen prvi del. Hkrati sem zagnal pripomoček in začel čakati na rezultat. Na žalost je ponoči - ko sem spal - program prenehal zbirati informacije zaradi hrošča. Naslednje jutro sem popravil napako, vendar se je statistika izkazala za manj kot en dan. Vendar pa so trendi očitni tudi glede opravljenega časa.

Podatki so na voljo za prvih 14 ur od trenutka objave, interval med meritvami je 10 minut.

O nenavadnostih habrostatistike

Oči nas niso varale: večina minusov se pojavi v prvi uri obstoja objave. Sprva je objava zašla v negativno območje, nato pa si je opomogla. Tu so številke, uporabljene za izris grafa:

O nenavadnostih habrostatistike

In to kljub temu, da ogledi gladko naraščajo!

O nenavadnostih habrostatistike

Koraki, ki se začnejo s tisočinkami vrednosti, so razloženi z dejstvom, da se okrajšave začnejo na plošči Khabrov: nikjer ni mogoče dobiti natančnega števila ogledov (verjetno bi lahko bilo vzeto iz storitev tretjih oseb, vendar jih nisem uporabil ).

Nisem strokovnjak za statistiko, ampak takšna porazdelitev minusov je nenormalna, kolikor razumem?!

Poglejte, zaznamki so bolj ali manj enakomerno porazdeljeni v obdobju registracije:

O nenavadnostih habrostatistike

Tudi komentarji so enakomerno porazdeljeni:

O nenavadnostih habrostatistike

Prisotni so izbruhi aktivnosti in pasivnosti, ki pa so tudi razporejeni po obdobju: komentiranje zbledi ali se obnovi.

Enako pri naročnikih – enoten rahel porast:

O nenavadnostih habrostatistike

Karma se v obdobju poročanja ni spremenila - ne navajam je. In oceno izračuna Habr, nima smisla navajati.

Vsi kazalci se spreminjajo sorazmerno s številom ogledov in le z minusi je nekaj narobe: do izbruha jeze pride v prvi uri od začetka objave. Enako se je zgodilo z mojimi prejšnjimi objavami. Toda če so bili prej to tako rekoč osebni vtisi, so zdaj potrjeni z registracijo.

Po mojem čisto noobskem mnenju taka distribucija pomeni: na spletnem mestu je več uporabnikov, ki namenoma gledajo zadnje objavljene objave in nekatere objave zavračajo - na podlagi samo njim znane potrebe. Pišem "nekaj objav", ker sem opazil ta učinek ne samo v svojih publikacijah. V vseh primerih je učinek izrazit, sicer mu enostavno ne bi posvečal pozornosti.

Imam štiri različice, zakaj se to zgodi.

Različica 1. Mentalna perverzija. Bolni ljudje namenoma bdijo nad avtorji, ki se jim zdijo neprijetni, in jih zavračajo, da bi jim škodovali.

Ne verjamem v to različico.

Različica 2. Psihološki učinek. Katero - ne vem. No, zakaj bralci najprej soglasno zavrnejo objavo, potem pa jo nič manj soglasno podprejo? So minus kot netematski, ampak plus po tem, da se poznavalci lepote znajdejo v večini? Ne vem.

Če so med bralci psihologi, naj povedo svoje.

Različica 3. Služabniki delujejo. Zakaj bi njihovi šefi širili gnilobo na položajih Khabrova? Bog ve. Vendar pa serviserji niso le pri nas. Kdo jih bo razumel, rusofobe?!

Različica 4. Kombinirani učinki prej omenjenih dejavnikov.

Čisto predstavljivo.

Kakor koli že, minuserjem uspe zmanjšati število ogledov. Nisem seznanjen s pravili za dvig objav Khabrova na vrh, sploh ne vem, ali so bili ti algoritmi javno objavljeni ali ne, vendar mi je očitno: zgodnji minus ne dovoljuje izobčenim objavam, da dosežejo vrh - natančneje, zamuja priti do tja, kar posledično včasih občutno zmanjša število ogledov.

Kolikor razumem, učinkovitih načinov za boj proti temu zlu ni. Edini način je osebno glasovanje. Samo v tem primeru lahko ugotovite, kateri profili občasno sledijo in brez zadnjih objav. Vendar na Habréju ni osebnega glasovanja (oziroma ni javno).

Ampak ni vse tako preprosto.

Kot rečeno, je bilo secirano gradivo objavljeno po delih. Po objavi drugega dela sem pričakoval podobno sliko: z začetnim izidom v minusu in naslednjim v plusu. Vendar se je izkazalo, da je učinek veliko bolj zglajen: objava se ni spremenila v minus.

Do objave drugega dela je bila napaka odpravljena, zato so podatki podani na dan:

O nenavadnostih habrostatistike

Ne vem, od kod glajenje. Morda zato, ker je bil objavljen v soboto (glasovi proti ob sobotah ne delujejo?) ali pa zato, ker je to konec že objavljenega gradiva.

Še vedno pa je porazdelitev minusov neenakomerna: vsi minusi se pojavijo v prvi polovici registracijskega obdobja, minus pa se konča veliko prej kot plus. Hkrati so ogledi porazdeljeni po obdobju natanko tako kot zadnjič - enakomerno:

O nenavadnostih habrostatistike

Skok, ki se je zgodil okoli treh popoldne, ni tajno gradivo. Za eno uro mi je zmanjkalo interneta. Pripomoček se ni mogel povezati s spletnim mestom.

O nenavadnostih habrostatistike

Vse ostalo je povsem standardno.

Zaznamki:

O nenavadnostih habrostatistike

Komentarji: kot zadnjič se obdobja aktivnosti izmenjujejo z obdobji tišine.

O nenavadnostih habrostatistike

Karma. Zabeleženo je bilo povečanje za nekaj enot – seveda ne sočasno:

O nenavadnostih habrostatistike

In naročniki. Skupno število je ostalo nespremenjeno (očitno so se interesenti prijavili ob izidu prvega dela). Ravno okoli enih popoldne je prišlo do enega samega nihanja: nekdo se je odjavil – morda pomotoma – a se je takoj znova prijavil. Če je šlo za drugo osebo, je prišlo do kompenzacije: skupno število naročnikov se ni spremenilo.

O nenavadnostih habrostatistike

Torej se meritve objave obnašajo jasno in predvidljivo. Vsi kazalniki, razen minusov. Ker za to ne vidim očitnega razloga, se mi zdi minus vrh najmanj čuden.

Nenavadnost 2.
Včasih se število ogledov zmanjša (kar je seveda nemogoče), vendar se kmalu vrne v normalno stanje.

Zasledil sem ga po naključju, med odpravljanjem napak v programu, ko funkcija izvoza in uvoza še ni bila priključena, zato na grafu manjka ustrezen cikcak. Lahko mi verjamete na besedo – ta učinek je bil opažen dvakrat. Več tisoč ogledov, nenadoma se število ogledov zmanjša za nekaj sto, po 10-20 minutah se povrne na prejšnjo raven (brez upoštevanja naravnega prirasta).

To je povsem preprosto: napaka na spletnem mestu. In ni kaj razmišljati.

Nenavadnost 3.
To se mi je zdelo veliko bolj nenavadno kot voluntaristični prvi in ​​tehnični drugi učinki. Plusi se ne zgodijo posamezno, z enakomerno porazdelitvijo v obdobju, ampak v blokih. Ampak dodajanje ni komentar, ko vprašanju seveda sledi odgovor, so dejanje posameznika!

Pobližje si oglejte zgoraj objavljene grafe rezultatov: bloki so opazni.

Poznavalci so mi prikimavali glede Poissonove porazdelitve, sama pa ne znam izračunati verjetnosti. Če ste sposobni, naredite matematiko. Že zdaj mi je očitno, da število dvojnih plusov močno presega normo.

Tukaj so digitalni podatki o prednostih prvega dela objave. Graf prikazuje število plusov, ki jih je mogoče pripisati enojnim, podvojenim in potrojenim položajem v skupnem številu danih ocen. Kot smo že omenili, je merilni interval 10 minut.

O nenavadnostih habrostatistike

Od 30 vbodov v 84 celicah sta bili dve celici vbodi trikrat. No, ne vem, koliko to ustreza teoriji verjetnosti ...

Podatki za drugi del objave (ker je obdobje merjenja daljše, ga zaradi primerljivosti skrajšujem glede na trajanje prvega dela):

O nenavadnostih habrostatistike

Mimogrede, tukaj je eden od posameznih plusov časovno sosednji potrojenemu, to je, da je v približno 20 minutah prišlo do porasta plusov (29% njihovega skupnega števila je bilo plusov). In to se ni zgodilo v prvih minutah objave.

Razmerje med enojnimi, dvojnimi in trojnimi pozicijami je približno enako kot pri prvem delu. Zmanjšanje deleža ocen v meritvah pa pojasnjujejo z redkejšim podajanjem ocen. Opravljene so bile meritve, vendar niso bile zabeležene nobene prednosti.

Tega block plus efekta nikakor ne morem razložiti, torej nikakor. Za slabosti se zdi, da takšno "kockasto" vedenje ni tipično.

Ali oddajniki dobrote pošiljajo predloge v serijah, se prižigajo in izklapljajo? hehehehe...

PS
Če bi kdo želel analizirati statistiko objave z naprednejšimi metodami ali preveriti aritmetiko, so datoteke z izvornimi podatki tukaj:
yadi.sk/d/iN4SL6tzsGEQxw

Ne vztrajam pri svojih dvomih - morda se motim, še posebej, ker je statistika mračna. Upam, da bodo komentarji profesionalnih statistikov, psihologov in drugih zainteresiranih uporabnikov razjasnili nastalo zmedo.

Hvala za vašo pozornost.

Vir: www.habr.com

Dodaj komentar