O dziwactwach habrostatystyki

Zauważyłem już dziwne zachowanie w ocenach, ale ostatnio stało się to zbyt oczywiste. I postanowiłem zbadać problem, korzystając z dostępnych mi metod naukowych, a mianowicie: analizować dynamikę plus-minus. Czy nagle sobie to wyobraziłeś?

Nadal jestem programistą, ale potrafię robić bardzo podstawowe rzeczy. Zakodowałem więc proste narzędzie, które zbiera statystyki z paneli postu Khabrov: zalety, wady, wyświetlenia, zakładki itp.

O dziwactwach habrostatystyki

Statystyki przedstawiają wykresy, po ich przestudiowaniu udało nam się odkryć jeszcze kilka niespodzianek, tych mniejszych. Ale najpierw sprawy.

Dziwność 1.
Od tego właściwie zaczęły się moje badania statystyczne.

Dziwne wydawało mi się, że w pierwszych godzinach po publikacji niektórych moich postów gwałtownie szły na minus, potem spadły do ​​zera i ostatecznie zapracowały na oczekiwany plus. Dlaczego to się stało?

Właśnie miałam opublikować kolejny post - w dwóch częściach. Postanowiłem poddać go analizie statystycznej.

Opublikowano pierwszą część. W tym samym czasie uruchomiłem narzędzie i zacząłem czekać na wynik. Niestety w nocy - gdy spałem - program przestał zbierać informacje ze względu na błąd. Następnego ranka poprawiłem błąd, ale statystyki okazały się trwać krócej niż jeden dzień. Trendy są jednak widoczne także w przypadku przepracowanego czasu.

Dane podawane są przez pierwsze 14 godzin od momentu publikacji, przerwa pomiędzy pomiarami wynosi 10 minut.

O dziwactwach habrostatystyki

Oczy nas nie myliły: większość minusów pojawia się w pierwszej godzinie istnienia postu. Początkowo post osiągnął poziom ujemny, potem powrócił do normy. Oto liczby użyte do wykreślenia wykresu:

O dziwactwach habrostatystyki

I to pomimo tego, że wyświetlenia rosną płynnie!

O dziwactwach habrostatystyki

Kroki rozpoczynające się od wartości tysięcznych tłumaczy fakt, że skróty zaczynają się w panelu Khabrov: nie ma gdzie uzyskać dokładnej liczby wyświetleń (prawdopodobnie można było to pobrać z usług stron trzecich, ale z nich nie korzystałem) ).

Nie znam się na statystyce, ale taki rozkład minusów jest, o ile rozumiem, nienormalny?!

Spójrz, zakładki rozkładają się mniej więcej równomiernie w okresie rejestracji:

O dziwactwach habrostatystyki

Komentarze są również rozłożone równomiernie:

O dziwactwach habrostatystyki

Występują wybuchy aktywności i bierności, ale są one również rozłożone w czasie: komentowanie albo zanika, albo wznawia się.

Podobnie jest z abonentami – następuje równomierny, niewielki wzrost:

O dziwactwach habrostatystyki

Karma nie uległa zmianie w okresie objętym raportem – nie cytuję tego. A ocenę wylicza Habr, nie ma sensu jej wymieniać.

Wszystkie wskaźniki zmieniają się proporcjonalnie do liczby wyświetleń i tylko z minusami jest coś nie tak: wybuch gniewu następuje w ciągu pierwszej godziny od rozpoczęcia publikacji. Podobnie było z moimi poprzednimi postami. Ale jeśli wcześniej były to, że tak powiem, osobiste wrażenia, teraz potwierdza je rejestracja.

Moim czysto noobskim zdaniem taki podział oznacza, że ​​na serwisie znajduje się kilku użytkowników, którzy celowo przeglądają najnowsze opublikowane posty i minusują niektóre z nich - kierując się tylko im znaną potrzebą. Piszę „niektóre posty”, bo zaobserwowałam ten efekt nie tylko w swoich publikacjach. We wszystkich przypadkach efekt jest wyraźny, w przeciwnym razie po prostu nie zwróciłbym na to uwagi.

Mam cztery wersje tego, dlaczego tak się dzieje.

Wersja 1. Perwersja mentalna. Chorzy ludzie celowo opiekują się autorami, których uważają za nieprzyjemnych i krytykują ich, mając na celu wyrządzenie im krzywdy.

Nie wierzę w tę wersję.

Wersja 2. Efekt psychologiczny. Który – nie wiem. Cóż, dlaczego czytelnicy najpierw jednomyślnie minusują post, a potem nie mniej jednomyślnie go popierają? Czy są minusy, bo nie tematyczne, ale plus, że koneserzy piękna znajdują się w większości? Nie wiem.

Jeśli wśród czytelników są psychologowie, pozwólcie im zabrać głos.

Wersja 3. Służby działają. Dlaczego ich szefowie mieliby siać zgniliznę na stanowiskach Khabrova? Bóg jeden wie. Jednak nie tylko w naszym kraju są żołnierze. Kto ich zrozumie, rusofobowie?!

Wersja 4. Połączone działanie wcześniej wymienionych czynników.

Całkiem wyobrażalne.

Tak czy inaczej, minuserom udaje się zmniejszyć liczbę wyświetleń. Nie znam zasad umieszczania postów Khabrova na górze, nie wiem nawet, czy te algorytmy zostały upublicznione, czy nie, ale dla mnie jest oczywiste: wczesny minus nie pozwala, aby ostracyzm posty dotarły na sam szczyt - dokładniej, opóźnia dotarcie do celu, co z kolei czasami znacznie zmniejsza liczbę wyświetleń.

O ile wiem, nie ma skutecznych sposobów walki z tym złem. Jedynym sposobem jest głosowanie osobiste. Tylko w tym przypadku możesz ustalić, które profile śledzą okresowo i pominąć najnowsze posty. Nie ma jednak osobistego głosowania w sprawie Habré (a raczej nie jest ono podawane do wiadomości publicznej).

Ale nie wszystko jest takie proste.

Jak powiedziałem, przeanalizowany materiał został opublikowany w częściach. Po publikacji drugiej części spodziewałem się podobnego obrazu: z wyjściem początkowym na minusie, a kolejnym na plusie. Efekt okazał się jednak znacznie bardziej wygładzony: post nie zamienił się w minus.

Do czasu opublikowania drugiej części błąd został naprawiony, więc dane podawane są dziennie:

O dziwactwach habrostatystyki

Nie wiem skąd to wygładzenie. Być może dlatego, że ukazał się w sobotę (w soboty nie działają minusy?), albo dlatego, że to koniec wcześniej opublikowanych materiałów.

Jednak rozkład minusów jest nadal nierówny: wszystkie minusy występują w pierwszej połowie okresu rejestracyjnego, a minus kończy się znacznie wcześniej niż plus. Jednocześnie wyświetlenia rozkładają się na przestrzeni okresu dokładnie tak jak ostatnim razem – równomiernie:

O dziwactwach habrostatystyki

Skok, który miał miejsce około trzeciej po południu, nie jest materiałem tajnym. Właśnie wyłączył mi się internet na godzinę. Narzędzie nie mogło połączyć się z witryną.

O dziwactwach habrostatystyki

Cała reszta jest całkowicie standardowa.

Zakładki:

O dziwactwach habrostatystyki

Komentarze: podobnie jak ostatnim razem, okresy aktywności przeplatają się z okresami ciszy.

O dziwactwach habrostatystyki

Karma. Zanotowano wzrost o kilka jednostek - oczywiście nie równoczesny:

O dziwactwach habrostatystyki

I abonentów. Ogólna liczba pozostała niezmieniona (najwyraźniej chętni zapisywali się już po ukazaniu się pierwszej części). Około pierwszej po południu nastąpiła jedna zmiana: ktoś wypisał się – być może przez pomyłkę – ale natychmiast zapisał się ponownie. Jeżeli była to inna osoba, następowała rekompensata: całkowita liczba abonentów nie uległa zmianie.

O dziwactwach habrostatystyki

Metryki postów zachowują się zatem w jasny i przewidywalny sposób. Wszystkie wskaźniki, z wyjątkiem minusów. Ponieważ nie widzę ku temu oczywistego powodu, szczyt ujemny wydaje mi się co najmniej dziwny.

Dziwność 2.
Czasami liczba wyświetleń spada (co oczywiście jest niemożliwe), ale wkrótce wraca do normy.

Namierzyłem to przez przypadek, podczas debugowania programu, gdy funkcja eksportu-importu nie była jeszcze dołączona, więc na wykresie brakuje odpowiedniego zygzaka. Możesz mi wierzyć na słowo – efekt ten zaobserwowano dwukrotnie. Kilka tysięcy wyświetleń, nagle liczba wyświetleń spada o kilkaset, po 10-20 minutach wraca do poprzedniego poziomu (bez uwzględnienia naturalnego przyrostu).

To całkiem proste: błąd na stronie. I nie ma o czym myśleć.

Dziwność 3.
To właśnie wydawało mi się znacznie dziwniejsze niż woluntarystyczny pierwszy efekt i techniczny drugi efekt. Plusy nie występują pojedynczo, z równomiernym rozkładem w okresie, ale w blokach. Ale dodawanie nie jest komentarzem, gdy po pytaniu naturalnie następuje odpowiedź, jest to akt indywidualny!

Przyjrzyj się bliżej opublikowanym powyżej wykresom wyników: zauważalne są bloki.

Osoby posiadające wiedzę kiwały mi głową w sprawie rozkładu Poissona, ale nie jestem w stanie samodzielnie obliczyć prawdopodobieństwa. Jeśli potrafisz, wykonaj obliczenia. Jest już dla mnie oczywiste, że liczba podwójnych plusów znacznie przekracza normę.

Oto cyfrowe dane na temat zalet pierwszej części wpisu. Wykres przedstawia liczbę plusów dla pozycji pojedynczych, podwójnych i potrójnych w ogólnej liczbie przyznanych ocen. Jak wspomniano wcześniej, odstęp między pomiarami wynosi 10 minut.

O dziwactwach habrostatystyki

Z 30 nakłuć w 84 komórkach dwie komórki zostały nakłute trzykrotnie. No cóż, nie wiem, na ile to się ma do teorii prawdopodobieństwa…

Dane do drugiej części wpisu (ze względu na dłuższy okres pomiarowy, dla porównywalności skracam go odpowiednio do czasu trwania pierwszej części):

O dziwactwach habrostatystyki

Nawiasem mówiąc, tutaj jeden z pojedynczych plusów sąsiaduje w czasie z potrójnym, to znaczy w ciągu około 20 minut nastąpił gwałtowny wzrost plusów (29% ich całkowitej liczby to plusy). A tak się nie stało w pierwszych minutach publikacji.

Zależność między pozycjami pojedynczymi, podwójnymi i potrójnymi jest w przybliżeniu taka sama jak w przypadku pierwszej części. Natomiast spadek udziału ocen w pomiarach tłumaczy się mniejszą częstotliwością wystawiania ocen. Dokonano pomiarów, ale nie odnotowano żadnych korzyści.

Nie potrafię w żaden sposób wytłumaczyć tego efektu bloku plus, czyli wcale. Jeśli chodzi o wady, takie „blokowe” zachowanie nie wydaje się typowe.

Czy emitenci dobroci wysyłają sugestie partiami, włączając i wyłączając? Hehehehe...

PS
Jeżeli ktoś chciałby przeanalizować statystyki postów bardziej zaawansowanymi metodami lub sprawdzić arytmetykę to pliki z danymi źródłowymi znajdują się tutaj:
yadi.sk/d/iN4SL6tzsGEQxw

Nie upieram się przy swoich wątpliwościach – być może się mylę, zwłaszcza że statystyki są ponure. Mam nadzieję, że komentarze profesjonalnych statystyków, psychologów i innych zainteresowanych użytkowników wyjaśnią powstałe zamieszanie.

Dziękuję za uwagę.

Źródło: www.habr.com

Dodaj komentarz