Аб дзівацтвах хабрастатыстыкі

І раней заўважаў дзіўныя паводзіны рэйтынгаў, але ў апошні час дзівацтва выявілася занадта навочна. І я вырашыў даследаваць праблему даступнымі мне навуковымі метадамі, а менавіта: прааналізаваць дынаміку плюсавання-мінусавання. Раптам прымроілася?

Праграміст я яшчэ той, але зусім элементарныя рэчы рабіць умею. Вось і закадзіў прасценькую ўтылітку, якая збірае статыстыку з панэляў хаброўскага паста: плюсы, мінусы, прагляды, закладкі і іншае.

Аб дзівацтвах хабрастатыстыкі

Статыстыка выводзіцца ў графікі, пасля вывучэння якіх удалося выявіць яшчэ пару нечаканасцяў, мяльчэй. Але пра ўсё па парадку.

Дзівацтва 1.
З яе, уласна, пачалося маё статыстычнае даследаванне.

Мне падалося дзіўным, што ў першыя гадзіны пасля апублікавання некаторых маіх пастоў яны рэзка сыходзілі ў мінус, затым абнуляліся і ў выніку зараблялі чаканы плюс. З чаго б гэта?

Я якраз збіраўся апублікаваць чарговую пасаду – у дзвюх частках. Яго і вырашыў падвергнуць статыстычнаму прэпараванню.

Апублікаваў першую частку. Адначасова запусціў утыліту і прыняўся чакаць выніку. Нажаль, уначы - у той час, пакуль я дрых, - праграма спыніла збор звестак з-за дапушчанага бага. Раніцай я выправіў памылку, але статыстыка аказалася за няпоўныя суткі. Зрэшты, тэндэнцыі відавочныя і за адпрацаваны час.

Дадзеныя прыводзяцца за першыя 14 гадзін з моманту апублікавання, інтэрвал паміж замерамі 10 хвілін.

Аб дзівацтвах хабрастатыстыкі

Вочы не падманулі: большасць мінусаў прыпадае на першую гадзіну існавання паста. Спачатку пост рэзка сышоў у мінус, затым выправіўся. Вось лічбы, па якіх выбудаваны графік:

Аб дзівацтвах хабрастатыстыкі

І гэта пры тым, што прагляды ўзрастаюць плаўна!

Аб дзівацтвах хабрастатыстыкі

Прыступкі, якія ідуць з тысячных значэнняў, тлумачацца тым, што ў хаброўскай панэлі пачынаюцца скарачэнні: дакладнай колькасці праглядаў узяць няма адкуль (напэўна, можна было ўзяць з іншых сэрвісаў, але імі я не карыстаўся).

Я ў статыстыцы не спец, але ж падобнае размеркаванне мінусаў анармальна, наколькі разумею?!

Вось глядзіце, закладкі размеркаваны па рэгістрацыйным перыядзе больш-менш раўнамерна:

Аб дзівацтвах хабрастатыстыкі

Каментары - таксама раўнамерна:

Аб дзівацтвах хабрастатыстыкі

Назіраюцца ўсплёскі актыўнасці і пасіўнасці, але і яны размеркаваны па перыядзе: каменціраванне то згасае, то аднаўляецца.

Тое ж з падпісчыкамі - мае месца раўнамернае нязначнае павелічэнне:

Аб дзівацтвах хабрастатыстыкі

Карма за справаздачны перыяд не змянілася - яе не прыводжу. А рэйтынг вылічаецца Хабрам, прыводзіць яго няма сэнсу.

Усе паказчыкі змяняюцца прапарцыйна колькасці праглядаў, і толькі з мінусамі робіцца нядобрае: выбліск злосці прыходзіцца на першую гадзіну з пачатку публікацыі. Тое ж самае назіралася з маімі папярэднімі пастамі. Але калі раней гэта былі, так бы мовіць, асабістыя ўражанні, то зараз іх пацвердзіла рэгістрацыя.

Па маім асабліва нубскім меркаванні, падобнае размеркаванне азначае: на сайце сядзяць некалькі карыстачоў, якія мэтанакіравана праглядаюць свежыя публікуемыя пасты і некаторыя з пастоў - зыходзячы з вядомай толькі ім запатрабавання - мінусуюць. Пішу "некаторыя з пастоў", таму што прыкмячаў дадзены эфект не толькі ў сваіх публікацый. Ва ўсіх выпадках эфект выяўлены, інакш я проста не звярнуў бы на яго ўвагі.

У мяне ёсць чатыры версіі, чаму так адбываецца.

Версія 1. Псіхічнае скрыўленне. Хворыя людзі спецыяльна вартуюць непрыемных ім аўтараў і мінусуюць, з мэтай нашкодзіць.

У гэтую вэрсію я ня веру.

Версія 2. Псіхалагічны эфект. Які - я не ведаю. Ну чаму чытачы спачатку дружна мінусуюць пост, затым не менш дружна плюсуюць? Мінусуюць як нетэматычны, а плюсуюць пасля таго, як знатакі прыгожага аказваюцца ў большасці? Не ведаю, не ведаю.

Калі сярод чытачоў ёсць псіхолагі, няхай скажуць сваё важкае слова.

Версія 3. Дзейнічаюць службовыя. Навошта іх начальству гнаць хаброўскія пасты - Бог вестка. Зрэшты, служывыя маюцца не толькі ў нашай айчыне. Хто іх зразумее, русафобаў?!

Версія 4. Камбінаванае ўздзеянне раней названых фактараў.

Суцэль уяўна.

Як бы там ні было, зменшыць колькасць праглядаў мінусатарам удаецца. Я не знаёмы з правіламі вываду хаброўскіх пастоў у топ, не ведаю нават, апублікаваны гэтыя алгарытмы ці не, але для мяне відавочна: ранняе мінусаванне не дае астракізму пастам выходзіць у топы - дакладней, затрымлівае трапленне туды, што ў сваю чаргу значна, у разы, памяншае колькасць праглядаў.

Наколькі разумею, дзейсных спосабаў барацьбы з гэтым злом не існуе. Адзіны спосаб - імянное галасаванне. Толькі ў такім выпадку можна ўсталяваць, з якіх профіляў ідзе перыядычнае адсочванне і мінусаванне свежых пастоў. Аднак, імянное галасаванне на Хабры адсутнічае (дакладней, не апублікуецца).

Але не ўсё так проста.

Як я сказаў, прэпараваны матэрыял публікаваўся па частках. Пасля публікацыі другой часткі я чакаў падобнай карціны: з пачатковым выхадам у мінус і наступным - у плюс. Аднак, эфект аказаўся куды больш згладжаным: пост у мінус не выходзіў.

Да часу публікацыі другой часткі баг быў выпраўлены, таму дадзеныя прыводзяцца за суткі:

Аб дзівацтвах хабрастатыстыкі

Адкуль узялося згладжванне, мне не вядома. Магчыма, з-за публікацыі ў суботу (мінусатары па суботах не працуюць?) ці з-за таго, што гэта заканчэнне раней апублікаванага матэрыялу.

Зрэшты, размеркаванне мінусаў усё роўна нераўнамернае: усе мінусы прыпадаюць на першую палову рэгістрацыйнага перыяду, і мінусаванне заканчваецца нашмат раней за плюсаванне. У той жа час прагляды размеркаваны па перыядзе дакладна як у мінулы раз - раўнамерна:

Аб дзівацтвах хабрастатыстыкі

Скачок, які адбыўся каля трох паполудні - гэта не сакрэтныя матэрыялы. Проста на гадзіну ў мяне адсек інтэрнэт. Утыліта не магла злучыцца з сайтам.

Аб дзівацтвах хабрастатыстыкі

Усё астатняе - цалкам стандартна.

Закладкі:

Аб дзівацтвах хабрастатыстыкі

Каментары: як і ў мінулы раз, перыяды актыўнасці чаргуюцца з перыядамі маўчання.

Аб дзівацтвах хабрастатыстыкі

Карма. Зафіксавана павелічэнне на пару адзінак - само сабой, не адначасовае:

Аб дзівацтвах хабрастатыстыкі

І падпісчыкі. Агульная колькасць засталася нязменнай (мабыць, жадаючыя падпісаліся пры публікацыі першай часткі). Толькі каля гадзіны папаўдні адбылася адзінкавая флуктуацыя: хтосьці адпісаўся - магчыма, памылкова, - але тут жа падпісаўся зноў. Калі гэта і быў іншы чалавек, адбылася кампенсацыя: агульная колькасць падпісчыкаў не змянілася.

Аб дзівацтвах хабрастатыстыкі

Такім чынам, паказчыкі посту паводзяць сябе зразумелай і прадказальнай выявай. Усе паказчыкі, за выключэннем мінусаў. Паколькі я не бачу відавочнай прычыны для гэтага, то знаходжу мінусатарскі пік як мінімум дзіўным.

Дзівацтва 2.
Часам колькасць праглядаў памяншаецца (што, зразумела, немагчыма), але неўзабаве вяртаецца ў нармальны стан.

Адсачыў выпадкова, падчас адладкі праграмы, калі функцыя экспарту-імпарту яшчэ не была прыроблена, таму на графіцы адпаведны зігзаг адсутнічае. Можаце паверыць на слова - дадзены эфект назіраўся двойчы. Некалькі тысяч праглядаў, раптоўна колькасць праглядаў памяншаецца на пару сотняў, хвілін праз 10-20 аднаўляецца да ранейшага ўзроўню (без уліку натуральнага павелічэння).

З гэтым зусім проста: баг на сайце. І думаць няма чаго.

Дзівацтва 3.
Вось што здалося мне куды больш дзіўным, чым валюнтарысцкі першы і тэхнічны другі эфекты. Плюсы здараюцца не адзінкава, з раўнамерным размеркаваннем па перыядзе, а блокамі. Але ж плюсаванне - не каментар, калі за пытаннем натуральна ідзе адказ, яны акт індывідуальны!

Дагледзіцеся на апублікаваныя вышэй графікі выніку: блокі прыкметныя.

Дасведчаныя людзі кіўнулі мне на размеркаванне Пуасона, але самастойна падлічыць верагоднасць я не ў стане. Калі вы здольныя, падлічвайце. Для мяне і без таго відавочна, што колькасць здвоеных плюсаў нашмат перавышае норму.

Вось лічбавыя дадзеныя па плюсах першай часткі паста. На графіцы паказана колькасць плюсаў, якія прыпадаюць на адзінкавыя, падвоеныя і патроеныя пазіцыі, у агульнай колькасці выстаўленых адзнак. Як гаварылася раней, інтэрвал замераў складае 10 хвілін.

Аб дзівацтвах хабрастатыстыкі

З 30 тычанняў у 84 клеткі ў дзве клеткі тыкнулі тройчы. Ну, не ведаю, наколькі гэта адпавядае тэорыі імавернасці…

Дадзеныя па другой частцы паста (паколькі перыяд вымярэнняў больш працяглы, скарачаю яго па працягласці першай часткі, для параўнальнасці):

Аб дзівацтвах хабрастатыстыкі

Між іншым, тут з патроеным суседнічае па часе адзін з адзінкавых плюсаў, гэта значыць у нейкія 20 хвілін назіраўся ўсплёск плюсавання (пастаўлена плюсаў 29% ад агульнай іх колькасці). І гэта адбывалася не ў першыя хвіліны апублікаваньня.

Суадносіны паміж адзінкавымі, падвоенымі і патроенымі пазіцыямі прыблізна тое ж самае, што для першай часткі. А памяншэнне дзелі адзнак у замерах тлумачыцца тым, што адзнакі выстаўляліся радзей. Замеры рабіліся, але плюсаў не фіксавалася.

Гэты эфект блокавага плюсавання я ніяк не магу растлумачыць, гэта значыць наогул ніяк. Для мінусаў падобныя «блочныя» паводзіны быццам бы не характэрна.

Выпраменьвальнікі дабра пасылаюць выклікання парцыённа, то ўключаючыся, то выключаючыся? Хе-хе-хе...

PS
Калі ў каго ўзнікне жаданне прааналізаваць статыстыку пастоў больш дасканалымі метадамі або праверыць арыфметыку, файлы з зыходнымі дадзенымі тут:
yadi.sk/d/iN4SL6tzsGEQxw

Не настойваю на сваіх сумневах - магчыма, я не мае рацыю, тым больш што ў статыстыцы іх бельмес. Спадзяюся, што каментары прафесійных статыстыкаў, псіхолагаў і іншых зацікаўленых карыстачоў растлумачаць узнікшае здзіўленне.

Дзякуй за ўвагу.

Крыніца: habr.com

Дадаць каментар