O zvláštnostiach habrostatistiky

Už predtým som si všimol zvláštne správanie v hodnoteniach, ale nedávno sa zvláštnosť stala príliš zjavnou. A rozhodol som sa problém preskúmať pomocou vedeckých metód, ktoré mám k dispozícii, konkrétne: analyzovať dynamiku plus-mínus. Zrazu ste si predstavili?

Stále som programátor, ale viem robiť úplne základné veci. Nakódoval som teda jednoduchý nástroj, ktorý zhromažďuje štatistiky z panelov príspevku Khabrov: klady, zápory, zobrazenia, záložky atď.

O zvláštnostiach habrostatistiky

Štatistiky sú zobrazené v grafoch, po preštudovaní ktorých sa nám podarilo objaviť ešte pár prekvapení, menších. Ale najprv to.

Zvláštnosť 1.
Tu sa vlastne začal môj štatistický výskum.

Zdalo sa mi zvláštne, že v prvých hodinách po zverejnení niektorých mojich príspevkov sa prudko zhoršili, potom klesli na nulu a nakoniec si vyslúžili očakávané plus. Prečo sa to stalo?

Práve som sa chystal zverejniť ďalší príspevok - v dvoch častiach. Rozhodol som sa ho podrobiť štatistickej analýze.

Zverejnená prvá časť. Zároveň som spustil nástroj a začal čakať na výsledok. Bohužiaľ, v noci - keď som spal - program prestal zbierať informácie kvôli chybe. Na druhý deň ráno som chybu opravil, ale štatistika sa ukázala byť za menej ako deň. Trendy sú však zrejmé aj za odpracovaný čas.

Údaje sa poskytujú za prvých 14 hodín od zverejnenia, interval medzi meraniami je 10 minút.

O zvláštnostiach habrostatistiky

Oči nás neklamali: väčšina mínusov sa vyskytuje v prvej hodine existencie príspevku. Najprv sa príspevok dostal do záporného územia, potom sa spamätal. Tu sú čísla použité na vykreslenie grafu:

O zvláštnostiach habrostatistiky

A to aj napriek tomu, že zhliadnutia plynule pribúdajú!

O zvláštnostiach habrostatistiky

Kroky začínajúce od tisícinových hodnôt sú vysvetlené skutočnosťou, že skratky začínajú na paneli Khabrov: nikde nie je možné získať presný počet zobrazení (pravdepodobne to mohlo byť prevzaté zo služieb tretích strán, ale nepoužil som ich ).

Nie som odborník na štatistiku, ale takéto rozdelenie mínusov je nenormálne, pokiaľ tomu rozumiem?!

Pozrite, záložky sú rozdelené viac-menej rovnomerne počas registračného obdobia:

O zvláštnostiach habrostatistiky

Komentáre sú tiež rovnomerne rozdelené:

O zvláštnostiach habrostatistiky

Dochádza k výbuchom aktivity a pasivity, ale sú tiež rozložené v priebehu obdobia: komentovanie buď zmizne, alebo sa obnoví.

To isté s predplatiteľmi – dochádza k rovnomernému miernemu nárastu:

O zvláštnostiach habrostatistiky

Karma sa počas sledovaného obdobia nezmenila – neuvádzam to. A hodnotenie vypočítava Habr, nemá zmysel vypisovať.

Všetky ukazovatele sa menia úmerne s počtom zobrazení a iba s mínusmi je niečo zlé: výbuch hnevu nastáva v prvej hodine od začiatku publikácie. To isté sa stalo s mojimi predchádzajúcimi príspevkami. Ak však skôr išlo o takpovediac osobné dojmy, teraz sú potvrdené registráciou.

Podľa môjho čisto noobského názoru takáto distribúcia znamená: na stránke je viacero užívateľov, ktorí si cielene prezerajú najnovšie zverejnené príspevky a niektorým príspevkom dávajú záporný hlas – na základe potreby, ktorú poznajú len oni. Píšem „niektoré z príspevkov“, pretože som si tento efekt všimol nielen v mojich publikáciách. Vo všetkých prípadoch je účinok výrazný, inak by som mu jednoducho nevenoval pozornosť.

Mám štyri verzie, prečo sa to deje.

Verzia 1. Duševná zvrátenosť. Chorí ľudia zámerne dozerajú na autorov, ktorí sa im zdajú nepríjemný a hlasujú proti nim s cieľom ublížiť im.

Ja tejto verzii neverím.

Verzia 2. Psychologický efekt. Ktorý - neviem. Prečo čitatelia príspevok najprv jednomyseľne mínusujú a potom ho nemenej jednohlasne zahlasujú? Sú mínusové ako netematické, ale plus po fajnšmekri krásy vo väčšine? Neviem.

Ak sú medzi čitateľmi psychológovia, nech sa k tomu vyjadria.

Verzia 3. Sluhovia konajú. Prečo by ich šéfovia mali šíriť hnilobu na Khabrovových postoch? Boh vie. Nielen u nás sú však opravári. Kto im bude rozumieť, rusofóbi?!

Verzia 4. Kombinované účinky vyššie uvedených faktorov.

Celkom predstaviteľné.

Nech je to akokoľvek, mínuskárom sa darí znižovať počet videní. Nie som oboznámený s pravidlami pre uvádzanie Khabrovových príspevkov na vrchol, dokonca ani neviem, či boli tieto algoritmy zverejnené alebo nie, ale je mi to jasné: skoré mínus neumožňuje ostrakizovaným príspevkom dostať sa hore - presnejšie povedané, oneskoruje sa tam, čo následne výrazne a časom znižuje počet zobrazení.

Pokiaľ som pochopil, neexistujú žiadne účinné spôsoby boja proti tomuto zlu. Jedinou cestou je osobné hlasovanie. Iba v tomto prípade môžete určiť, ktoré profily pravidelne sledujú, a mínus posledné príspevky. Osobné hlasovanie o Habrém však neprebieha (alebo skôr nie je zverejnené).

Ale nie všetko je také jednoduché.

Ako som povedal, rozobraný materiál bol publikovaný po častiach. Po zverejnení druhej časti som očakával podobný obraz: s počiatočným výstupom v mínuse a následným v pluse. Efekt sa však ukázal byť oveľa vyhladenejší: príspevok sa nezmenil na mínus.

V čase publikovania druhej časti bola chyba opravená, takže údaje sú uvedené za deň:

O zvláštnostiach habrostatistiky

Neviem, kde sa to vyhladenie vzalo. Možno preto, že bol uverejnený v sobotu (hlasovanie proti v sobotu nefunguje?) alebo preto, že toto je koniec predtým publikovaného materiálu.

Rozdelenie mínusov je však stále nerovnomerné: všetky mínusy sa vyskytujú v prvej polovici registračného obdobia a mínus sa končí oveľa skôr ako plus. Zároveň sú zobrazenia rozložené za obdobie presne ako naposledy – rovnomerne:

O zvláštnostiach habrostatistiky

Nárast, ku ktorému došlo okolo tretej popoludní, nie je utajovaným materiálom. Práve mi na hodinu vypadol internet. Obslužnému programu sa nepodarilo pripojiť k lokalite.

O zvláštnostiach habrostatistiky

Všetko ostatné je úplne štandardné.

Záložky:

O zvláštnostiach habrostatistiky

Komentár: ako minule, obdobia aktivity sa striedajú s obdobiami ticha.

O zvláštnostiach habrostatistiky

Karma. Bol zaznamenaný nárast o niekoľko jednotiek - samozrejme, nie súčasne:

O zvláštnostiach habrostatistiky

A predplatiteľov. Celkový počet zostal nezmenený (záujemcovia sa zrejme prihlásili pri vydaní prvého dielu). Práve okolo jednej poobede došlo k jedinému výkyvu: niekto sa – možno omylom – odhlásil, no hneď sa prihlásil znova. Ak išlo o inú osobu, došlo k kompenzácii: celkový počet predplatiteľov sa nezmenil.

O zvláštnostiach habrostatistiky

Metriky príspevkov sa teda správajú jasne a predvídateľne. Všetky ukazovatele, okrem mínusov. Keďže na to nevidím žiadny zjavný dôvod, považujem mínusový vrchol za prinajmenšom zvláštny.

Zvláštnosť 2.
Niekedy sa počet zobrazení zníži (čo je, samozrejme, nemožné), ale čoskoro sa vráti do normálu.

Sledoval som to náhodou pri ladení programu, keď ešte nebola pripojená funkcia export-import, takže na grafe chýba zodpovedajúce cikcak. Môžete mi vziať slovo - tento efekt bol pozorovaný dvakrát. Niekoľko tisíc zobrazení, zrazu sa počet zobrazení zníži o niekoľko stoviek, po 10-20 minútach sa obnoví na predchádzajúcu úroveň (bez zohľadnenia prirodzeného nárastu).

Je to celkom jednoduché: chyba na stránke. A nie je nad čím rozmýšľať.

Zvláštnosť 3.
Práve to sa mi zdalo oveľa čudnejšie ako voluntaristický prvý a technický druhý efekt. Plusy sa nedejú jednotlivo, s rovnomerným rozložením počas obdobia, ale v blokoch. Ale pridávanie nie je komentár, keď po otázke prirodzene nasleduje odpoveď, ide o individuálny akt!

Pozrite sa bližšie na vyššie publikované grafy výsledkov: bloky sú viditeľné.

Znalí ľudia mi prikývli na Poissonovo rozdelenie, ale sám neviem vypočítať pravdepodobnosť. Ak ste schopní, počítajte. Už teraz mi je zrejmé, že počet dvojitých plusov ďaleko presahuje normu.

Tu sú digitálne údaje o výhodách prvej časti príspevku. Graf zobrazuje počet plusov pre jednoduché, dvojité a trojité pozície v celkovom počte udaných hodnotení. Ako už bolo spomenuté, interval merania je 10 minút.

O zvláštnostiach habrostatistiky

Z 30 šťouchnutí v 84 bunkách boli dve bunky šťouchané trikrát. No, neviem, nakoľko to zodpovedá teórii pravdepodobnosti...

Údaje k druhej časti príspevku (keďže doba merania je dlhšia, pre porovnateľnosť ju skracujem podľa dĺžky trvania prvej časti):

O zvláštnostiach habrostatistiky

Mimochodom, jeden z jednotlivých plusov tu časovo susedí s trojitým, to znamená, že za nejakých 20 minút nastal prudký nárast plusov (29 % z ich celkového počtu tvorili plusy). A to sa nestalo v prvých minútach zverejnenia.

Vzťah medzi jednoduchými, dvojitými a trojitými polohami je približne rovnaký ako v prvej časti. A pokles podielu hodnotení v meraniach sa vysvetľuje tým, že hodnotenia boli udeľované menej často. Uskutočnili sa merania, ale nezaznamenali sa žiadne výhody.

Tento blok plus efekt si neviem nijako vysvetliť, teda vôbec nie. Pokiaľ ide o nevýhody, takéto „blokové“ správanie sa nezdá byť typické.

Posielajú žiariče dobroty návrhy v dávkach, zapínajú sa a vypínajú? Hehehehe...

PS
Ak by niekto chcel analyzovať štatistiky príspevkov pomocou pokročilejších metód alebo skontrolovať aritmetiku, súbory so zdrojovými údajmi sú tu:
yadi.sk/d/iN4SL6tzsGEQxw

Netrvám na svojich pochybnostiach - možno sa mýlim, najmä preto, že štatistiky sú pochmúrne. Dúfam, že komentáre profesionálnych štatistikov, psychológov a iných zainteresovaných používateľov objasnia vzniknutý zmätok.

Ďakujem vám za pozornosť.

Zdroj: hab.com

Pridať komentár