O zvláštnostech habrostatistiky

Už dříve jsem si všiml podivného chování v hodnoceních, ale nedávno se podivnost stala příliš zřejmou. A rozhodl jsem se problém prozkoumat pomocí vědeckých metod, které mám k dispozici, jmenovitě: analyzovat dynamiku plus-minus. Najednou jste si představili?

Stále jsem programátor, ale umím úplně základní věci. Nakódoval jsem tedy jednoduchý nástroj, který shromažďuje statistiky z panelů příspěvku Khabrov: klady, zápory, zobrazení, záložky atd.

O zvláštnostech habrostatistiky

Statistiky jsou zobrazeny v grafech, po jejichž prostudování se nám podařilo objevit ještě pár překvapení, menších. Ale nejdřív.

Divnost 1.
Tady vlastně začal můj statistický výzkum.

Přišlo mi divné, že v prvních hodinách po zveřejnění některých mých příspěvků šly prudce do záporu, pak na nulu a nakonec si vysloužily očekávané plus. Proč se to stalo?

Právě jsem se chystal publikovat další příspěvek - ve dvou částech. Rozhodl jsem se ho podrobit statistické analýze.

Zveřejněna první část. Současně jsem spustil nástroj a začal čekat na výsledek. Bohužel v noci - když jsem spal - program přestal sbírat informace kvůli chybě. Druhý den ráno jsem chybu opravil, ale statistika se ukázala být za méně než den. Trendy jsou však zřejmé i za odpracovanou dobu.

Údaje jsou poskytovány za prvních 14 hodin od okamžiku zveřejnění, interval mezi měřeními je 10 minut.

O zvláštnostech habrostatistiky

Oči nás neklamaly: většina mínusů se objevuje v první hodině existence příspěvku. Nejprve se příspěvek dostal do záporného teritoria, pak se vzpamatoval. Zde jsou čísla použitá k vykreslení grafu:

O zvláštnostech habrostatistiky

A to i přesto, že zhlédnutí plynule přibývají!

O zvláštnostech habrostatistiky

Kroky začínající od tisícin jsou vysvětleny skutečností, že zkratky začínají na panelu Khabrov: není kde získat přesný počet zobrazení (pravděpodobně to mohlo být převzato ze služeb třetích stran, ale nepoužil jsem je ).

Nejsem odborník na statistiky, ale takové rozdělení mínusů je nenormální, pokud tomu rozumím?!

Podívejte se, záložky jsou rozmístěny víceméně rovnoměrně po dobu registrace:

O zvláštnostech habrostatistiky

Komentáře jsou také rovnoměrně rozmístěny:

O zvláštnostech habrostatistiky

Dochází k výbuchům aktivity a pasivity, ale jsou také rozloženy do období: komentování buď odezní, nebo se obnoví.

Totéž s předplatiteli – dochází k rovnoměrnému mírnému nárůstu:

O zvláštnostech habrostatistiky

Karma se během sledovaného období nezměnila – neuvádím ji. A hodnocení počítá Habr, nemá cenu to vypisovat.

Všechny ukazatele se mění úměrně počtu zhlédnutí a jen s mínusy je něco špatně: výbuch hněvu nastává v první hodině od začátku publikace. To samé se stalo s mými předchozími příspěvky. Ale pokud to dříve byly, abych tak řekl, osobní dojmy, nyní jsou potvrzeny registrací.

Podle mého čistě noobského názoru taková distribuce znamená: na webu je několik uživatelů, kteří si cíleně prohlížejí poslední zveřejněné příspěvky a některým příspěvkům hlasují proti – na základě potřeby, kterou znají jen oni. Píšu „některé z příspěvků“, protože jsem tento efekt zaznamenal nejen ve svých publikacích. Ve všech případech je účinek výrazný, jinak bych tomu prostě nevěnoval pozornost.

Mám čtyři verze, proč se to děje.

Verze 1. Mentální zvrácenost. Nemocní lidé záměrně hlídají autory, které považují za nepříjemné, a hlasují proti nim s cílem ublížit jim.

Této verzi nevěřím.

Verze 2. Psychologický efekt. Který - nevím. Proč čtenáři příspěvek nejprve jednomyslně minusují, pak jej neméně jednomyslně odhlasují? Jsou mínusy jako netematické, ale plus po znalci krásy se nacházejí ve většině? Nevím.

Pokud jsou mezi čtenáři psychologové, ať se k tomu vyjádří.

Verze 3. Sluhové jednají. Proč by jejich šéfové měli šířit hnilobu na Khabrovových postech? Bůh ví. Nejen u nás jsou však opraváři. Kdo jim bude rozumět, rusofobové?!

Verze 4. Kombinované účinky výše uvedených faktorů.

Docela představitelné.

Ať je to jak chce, minuserům se daří snižovat počet zhlédnutí. Nejsem obeznámen s pravidly pro uvádění Khabrovových příspěvků na vrchol, ani nevím, zda byly tyto algoritmy zveřejněny nebo ne, ale je mi to jasné: brzké mínus nedovolí, aby se vyloučené příspěvky dostaly nahoru - přesněji řečeno, zdržuje se tam, což zase výrazně a časem snižuje počet zhlédnutí.

Pokud jsem pochopil, neexistují žádné účinné způsoby, jak bojovat proti tomuto zlu. Jedinou možností je osobní hlasování. Pouze v tomto případě můžete určit, které profily jsou pravidelně sledovány, a bez nejnovějších příspěvků. Žádné osobní hlasování o Habrém však neprobíhá (nebo spíše není zveřejněno).

Ale ne všechno je tak jednoduché.

Jak jsem řekl, rozpitvaný materiál byl publikován po částech. Po vydání druhého dílu jsem očekával podobný obrázek: s počátečním výstupem v mínusu a následným v plusu. Efekt se však ukázal být mnohem uhlazenější: příspěvek se nezměnil v mínus.

V době vydání druhého dílu byla chyba opravena, takže údaje jsou uvedeny za den:

O zvláštnostech habrostatistiky

Nevím, kde se to vyhlazení vzalo. Možná proto, že byl zveřejněn v sobotu (v sobotu nefungují záporné hlasy?) nebo proto, že tímto končí dříve publikovaný materiál.

Rozdělení mínusů je však stále nerovnoměrné: všechny mínusy se vyskytují v první polovině registračního období a mínus končí mnohem dříve než plus. Zároveň jsou zobrazení rozložena za období přesně jako minule – rovnoměrně:

O zvláštnostech habrostatistiky

Nárůst, ke kterému došlo kolem třetí hodiny odpoledne, není utajovaným materiálem. Právě mi na hodinu vypadl internet. Nástroj se nemohl připojit k webu.

O zvláštnostech habrostatistiky

Vše ostatní je zcela standardní.

Záložky:

O zvláštnostech habrostatistiky

Komentář: Stejně jako minule se střídají období aktivity s obdobími ticha.

O zvláštnostech habrostatistiky

Karma. Byl zaznamenán nárůst o několik jednotek - samozřejmě ne současně:

O zvláštnostech habrostatistiky

A předplatitelé. Celkový počet zůstal nezměněn (zřejmě se zájemci přihlásili při vydání prvního dílu). Jen kolem jedné hodiny odpoledne došlo k jedinému výkyvu: někdo se – možná omylem – odhlásil, ale hned se zase přihlásil. Pokud se jednalo o jinou osobu, došlo ke kompenzaci: celkový počet účastníků se nezměnil.

O zvláštnostech habrostatistiky

Metriky příspěvků se tedy chovají jasně a předvídatelně. Všechny ukazatele, kromě mínusů. Protože pro to nevidím žádný zřejmý důvod, považuji minusový vrchol za přinejmenším zvláštní.

Divnost 2.
Někdy se počet zhlédnutí sníží (což je samozřejmě nemožné), ale brzy se vrátí k normálu.

Sledoval jsem to náhodou, při ladění programu, kdy ještě nebyla připojena funkce export-import, takže na grafu chybí odpovídající klikatí. Můžete mě vzít za slovo - tento efekt byl pozorován dvakrát. Několik tisíc zobrazení, najednou se počet zobrazení sníží o několik stovek, po 10-20 minutách se vrátí na předchozí úroveň (bez zohlednění přirozeného nárůstu).

To je docela jednoduché: chyba na webu. A není o čem přemýšlet.

Divnost 3.
Právě to se mi zdálo mnohem podivnější než voluntaristický první a technický druhý efekt. Plusy se nedějí jednotlivě, s rovnoměrným rozložením během období, ale v blocích. Ale přidávání není komentář, když po otázce přirozeně následuje odpověď, jde o individuální akt!

Podívejte se blíže na výše zveřejněné grafy výsledků: bloky jsou patrné.

Znalí lidé mi kývli na Poissonovo rozdělení, ale nejsem schopen sám vypočítat pravděpodobnost. Pokud jste schopni, spočítejte si to. Už teď je mi zřejmé, že počet dvojitých plusů daleko přesahuje normu.

Zde jsou digitální údaje o výhodách první části příspěvku. V grafu je uveden počet plusů pro jednoduché, dvojité a trojité pozice v celkovém počtu udělených hodnocení. Jak již bylo zmíněno, interval měření je 10 minut.

O zvláštnostech habrostatistiky

Z 30 šťouchnutí v 84 buňkách byly dvě buňky šťouchány třikrát. No, nevím, jak moc to odpovídá teorii pravděpodobnosti...

Údaje pro druhou část příspěvku (protože doba měření je delší, zkracuji ji pro srovnatelnost podle délky trvání první části):

O zvláštnostech habrostatistiky

Mimochodem, zde jedno z jednotlivých plusů časově sousedí s trojitým, to znamená, že za nějakých 20 minut došlo k nárůstu plusů (29 % z jejich celkového počtu byly plusy). A to se v prvních minutách publikace nestalo.

Vztah mezi jednoduchou, dvojitou a trojitou pozicí je přibližně stejný jako u prvního dílu. A pokles podílu hodnocení v měření se vysvětluje tím, že hodnocení bylo udělováno méně často. Byla provedena měření, ale nebyly zaznamenány žádné výhody.

Tento blok plus efekt si nedokážu nijak vysvětlit, tedy vůbec. Pokud jde o nevýhody, takové „blokové“ chování se nezdá být typické.

Posílají vysílače dobroty návrhy v dávkách, zapínají se a vypínají? Hehehehe...

PS
Pokud by někdo chtěl analyzovat statistiky příspěvků pomocí pokročilejších metod nebo zkontrolovat aritmetiku, soubory se zdrojovými daty jsou zde:
yadi.sk/d/iN4SL6tzsGEQxw

Netrvám na svých pochybách – možná se mýlím, zvláště když statistiky jsou ponuré. Doufám, že komentáře profesionálních statistiků, psychologů a dalších zainteresovaných uživatelů objasní vzniklý zmatek.

Děkuji vám za pozornost.

Zdroj: www.habr.com

Přidat komentář