О необичностима хабростатистике

Приметио сам и раније чудно понашање у оценама, али недавно је необичност постало превише очигледна. И одлучио сам да истражим проблем користећи научне методе које су ми доступне, а то су: да анализирам динамику плус-минус. Да ли сте се одједном замислили?

Још увек сам програмер, али могу да радим веома основне ствари. Тако сам кодирао једноставан услужни програм који прикупља статистику са панела Кхабров поста: предности, мане, прегледи, обележивачи итд.

О необичностима хабростатистике

Статистика је приказана у графиконима, након проучавања којих смо успели да откријемо још пар изненађења, мањих. Али прво ствари.

Чудност 1.
Ту је заправо почело моје статистичко истраживање.

Учинило ми се чудним да су у првим сатима након објављивања неких мојих постова нагло пали у негативу, па на нулу и на крају зарадили очекивани плус. Зашто се то догодило?

Управо сам хтео да објавим још један пост - у два дела. Одлучио сам да га подвргнем статистичкој анализи.

Објављен први део. Истовремено сам покренуо услужни програм и почео да чекам резултат. Нажалост, ноћу - док сам спавао - програм је престао да прикупља информације због грешке. Следећег јутра сам исправио грешку, али се показало да је статистика била за мање од једног дана. Међутим, трендови су очигледни и за време рада.

Подаци се дају за првих 14 сати од тренутка објављивања, интервал између мерења је 10 минута.

О необичностима хабростатистике

Очи нас нису превариле: већина минуса јавља се у првом сату постојања поста. Прво је пошта ушла у негативну територију, а затим се опоравила. Ево бројева који се користе за цртање графикона:

О необичностима хабростатистике

И то упркос чињеници да се прегледи глатко повећавају!

О необичностима хабростатистике

Кораци који почињу од хиљадитих вредности објашњавају се чињеницом да скраћенице почињу на панелу Кхабров: нема где да се добије тачан број прегледа (вероватно је могао бити преузет од услуга трећих страна, али их нисам користио ).

Нисам стручњак за статистику, али оваква расподела минуса је ненормална, колико разумем?!

Погледајте, обележивачи су распоређени мање-више равномерно током периода регистрације:

О необичностима хабростатистике

Коментари су такође равномерно распоређени:

О необичностима хабростатистике

Постоје навале активности и пасивности, али су такође распоређени током периода: коментарисање или бледи или се наставља.

Исто је и са претплатницима – постоји уједначен благи пораст:

О необичностима хабростатистике

Карма се није променила током извештајног периода - не цитирам је. А рејтинг израчунава Хабр, нема смисла набрајати га.

Сви показатељи се мењају пропорционално броју прегледа, а само са минусима нешто није у реду: излив беса се јавља у првом сату од почетка објављивања. Иста ствар се десила и са мојим претходним постовима. Али ако су раније то били, да тако кажем, лични утисци, сада су потврђени регистрацијом.

По мом чисто нообском мишљењу, таква дистрибуција значи: постоји неколико корисника на сајту који намерно прегледају најновије објављене постове и омаловажавају неке од постова - на основу само њима познате потребе. Пишем „неке од постова“ јер сам приметио овај ефекат не само у својим публикацијама. У свим случајевима, ефекат је изражен, иначе једноставно не бих обраћао пажњу на то.

Имам четири верзије зашто се то дешава.

Верзија 1. Ментална перверзија. Болесни људи намерно бдију над ауторима који им се не свиђају и омаловажавају их са циљем да им нашкоде.

Не верујем у ову верзију.

Верзија 2. Психолошки ефекат. Који - не знам. Па, зашто читаоци прво једногласно минусирају пост, а онда га ништа мање једногласно гласају? Да ли су минус као нетематски, али плус после познаваоци лепоте се налазе у већини? Не знам.

Ако међу читаоцима има психолога, нека кажу своје.

Верзија 3. Слуге глуме. Зашто би њихови шефови ширили трулеж по Хабровљевим положајима? Међутим, војних лица има не само у нашој земљи. Ко ће их разумети, русофоби?!

Верзија 4. Комбиновани ефекти претходно наведених фактора.

Сасвим замисливо.

Било како било, минусери успевају да смање број прегледа. Нисам упознат са правилима за довођење Хабровљевих постова на врх, не знам ни да ли су ови алгоритми објављени или не, али ми је очигледно: рани минус не дозвољава остракираним објавама да дођу до врха - тачније, одлаже долазак, што заузврат значајно, временом, смањује број прегледа.

Колико ја разумем, не постоје ефикасни начини за борбу против овог зла. Једини начин је лично гласање. Само у овом случају можете утврдити који профили периодично прате и минус најновије објаве. Међутим, на Хабреу нема личног гласања (тачније, не објављује се).

Али није све тако једноставно.

Као што сам рекао, рашчлањени материјал је објављен у деловима. Након објављивања другог дела, очекивао сам сличну слику: са почетним излазом у минусу и следећим у плусу. Међутим, ефекат се показао много изглађенијим: пост се није претворио у минус.

До објављивања другог дела, грешка је била исправљена, па су подаци дати по дану:

О необичностима хабростатистике

Не знам одакле је дошло глачање. Можда зато што је објављено у суботу (давање гласа не ради суботом?) или зато што је ово крај претходно објављеног материјала.

Међутим, расподела минуса је и даље неуједначена: сви минуси се јављају у првој половини периода регистрације, а минус се завршава много раније од плуса. У исто време, прегледи су распоређени током периода тачно као и прошли пут - равномерно:

О необичностима хабростатистике

Шиљак који се догодио око три поподне није поверљив материјал. Интернет ми је нестао на сат времена. Услужни програм није могао да се повеже са сајтом.

О необичностима хабростатистике

Све остало је потпуно стандардно.

Обележивача:

О необичностима хабростатистике

Коментари: као и прошли пут, периоди активности се смењују са периодима тишине.

О необичностима хабростатистике

Карма. Забележен је пораст од неколико јединица - наравно, не истовремено:

О необичностима хабростатистике

И претплатници. Укупан број је остао непромењен (очигледно, заинтересовани су се пријавили када је први део објављен). Негде око један сат после подне дошло је до једне флуктуације: неко је отказао претплату - можда грешком - али се одмах поново пријавио. Ако је у питању друга особа, дошло је до компензације: укупан број претплатника се није променио.

О необичностима хабростатистике

Дакле, пост метрика се понаша на јасан и предвидљив начин. Сви показатељи, осим минуса. Пошто не видим очигледан разлог за ово, сматрам да је минус врх у најмању руку чудан.

Чудност 2.
Понекад се број прегледа смањи (што је, наравно, немогуће), али се убрзо враћа у нормалу.

Пратио сам га случајно, приликом отклањања грешака у програму, када експорт-увоз функција још није била прикачена, па одговарајући цик-цак недостаје на графикону. Можете ми веровати на реч - овај ефекат је примећен два пута. Неколико хиљада прегледа, одједном се број прегледа смањи за пар стотина, након 10-20 минута се враћа на претходни ниво (без узимања у обзир природног прираштаја).

Ово је прилично једноставно: грешка на сајту. И нема шта да се размишља.

Чудност 3.
То је оно што ми се чинило много чудније од волунтаристичког првог и техничког другог ефекта. Плусеви се не дешавају појединачно, са равномерном дистрибуцијом током периода, већ у блоковима. Али додавање није коментар, када је питање природно праћено одговором, то је индивидуални чин!

Погледајте ближе графиконе резултата објављене изнад: блокови су уочљиви.

Упућени људи су ми климали главом о Поасоновој расподели, али ја не могу сам да израчунам вероватноћу. Ако сте у могућности, урадите математику. Већ ми је очигледно да број дуплих плусева далеко превазилази норму.

Ево дигиталних података о предностима првог дела поста. На графикону је приказан број плусева за једноструке, двоструке и троструке позиције у укупном броју датих оцена. Као што је раније поменуто, интервал мерења је 10 минута.

О необичностима хабростатистике

Од 30 убода у 84 ћелије, две ћелије су прободене три пута. Па, не знам колико ово одговара теорији вероватноће...

Подаци за други део поста (пошто је период мерења дужи, скраћујем га у складу са трајањем првог дела, ради упоредивости):

О необичностима хабростатистике

Иначе, овде је један од појединачних плусева временски поред утрострученог, односно за неких 20 минута дошло је до пораста плусева (29% њиховог укупног броја су били плусеви). А то се није догодило у првим минутима објављивања.

Однос између једноструких, двоструких и троструких позиција је приближно исти као у првом делу. А смањење удела оцена у мерењима објашњава се чињеницом да су оцене даване ређе. Извршена су мерења, али предности нису забележене.

Не могу никако да објасним овај блок плус ефекат, односно никако. Што се тиче недостатака, такво „блокирано“ понашање не изгледа типично.

Да ли емитери доброте шаљу сугестије у серијама, укључују се и искључују? хехехехе...

ПС
Ако неко жели да анализира статистику објава користећи напредније методе или да провери аритметику, фајлови са изворним подацима су овде:
иади.ск/д/иН4СЛ6тзсГЕКкв

Не инсистирам на својим сумњама - можда грешим, поготово што је статистика суморна. Надам се да ће коментари професионалних статистичара, психолога и других заинтересованих корисника разјаснити забуну која је настала.

Хвала вам на пажњи.

Извор: ввв.хабр.цом

Додај коментар