За странностите на хабростатистиката

Забелязах странно поведение в рейтингите и преди, но напоследък странността стана твърде очевидна. И реших да изследвам проблема, използвайки научните методи, които са ми достъпни, а именно: да анализирам динамиката на плюс-минус. Внезапно ли си представихте?

Все още съм програмист, но мога да правя много основни неща. Затова кодирах проста помощна програма, която събира статистика от панелите на публикацията в Хабров: плюсове, минуси, изгледи, отметки и т.н.

За странностите на хабростатистиката

Статистиката се показва в графики, след изучаването на които успяхме да открием още няколко изненади, по-малки. Но на първо място.

странност 1.
Тук всъщност започна моето статистическо изследване.

Струваше ми се странно, че в първите часове след публикуването на някои от публикациите ми те рязко минаха на минус, след това на нула и в крайна сметка спечелиха очаквания плюс. защо стана така

Тъкмо се канех да публикувам друга публикация - в две части. Реших да го подложа на статистически анализ.

Публикувана първа част. В същото време стартирах помощната програма и започнах да чакам резултата. За съжаление през нощта - докато спях - програмата спря да събира информация поради бъг. На следващата сутрин коригирах грешката, но статистиката се оказа за по-малко от ден. Тенденциите обаче са очевидни и за отработеното време.

Данните се предоставят за първите 14 часа от момента на публикуване, интервалът между измерванията е 10 минути.

За странностите на хабростатистиката

Очите не ни излъгаха: повечето от минусите се появяват през първия час от съществуването на публикацията. Първоначално публикацията влезе в отрицателна територия, след което се възстанови. Ето числата, използвани за начертаване на графиката:

За странностите на хабростатистиката

И това въпреки факта, че гледанията се увеличават плавно!

За странностите на хабростатистиката

Стъпките, започващи от хилядна стойност, се обясняват с факта, че съкращенията започват в панела Khabrov: няма къде да получите точния брой изгледи (вероятно може да е взет от услуги на трети страни, но не ги използвах ).

Не съм експерт по статистика, но такова разпределение на минусите е ненормално, доколкото разбирам?!

Вижте, отметките са разпределени повече или по-малко равномерно през периода на регистрация:

За странностите на хабростатистиката

Коментарите също са равномерно разпределени:

За странностите на хабростатистиката

Има изблици на активност и пасивност, но и те са разпределени през периода: коментирането или заглъхва, или се възобновява.

Същото и с абонатите – има равномерно леко увеличение:

За странностите на хабростатистиката

Кармата не се е променила през отчетния период - не я цитирам. И рейтингът се изчислява от Habr, няма смисъл да го изброявате.

Всички показатели се променят пропорционално на броя гледания и само с минусите нещо не е наред: избликът на гняв се случва в първия час от началото на публикуването. Същото се случи и с предишните ми публикации. Но ако по-рано това бяха, така да се каже, лични впечатления, сега те се потвърждават от регистрация.

Според моето чисто нубско мнение подобно разпределение означава: има няколко потребители на сайта, които целенасочено преглеждат последните публикувани публикации и гласуват против някои от публикациите - въз основа на нужда, известна само на тях. Пиша „някои от публикациите“, защото забелязах този ефект не само в моите публикации. Във всички случаи ефектът е ясно изразен, иначе просто не бих му обърнал внимание.

Имам четири версии защо това се случва.

Версия 1. Психическа перверзия. Болните хора съзнателно наблюдават авторите, които смятат за неприятни, и ги отхвърлят, с цел да им навредят.

Не вярвам в тази версия.

Версия 2. Психологически ефект. Кое - не знам. Е, защо читателите първо единодушно минус публикацията, а след това не по-малко единодушно я гласуват за? Минус ли са като нетематични, но плюс, след като ценителите на красотата се оказват мнозинство? Не знам.

Ако сред читателите има психолози, нека си кажат думата.

Версия 3. Слугите действат. Защо шефовете им да сеят гнило по постовете на Хабров, Бог знае. Военнослужещи обаче има не само у нас. Кой ще ги разбере, русофобите?!

Версия 4. Комбинирани ефекти от гореспоменатите фактори.

Съвсем въобразимо.

Както и да е, minusers успяват да намалят броя на гледанията. Не съм запознат с правилата за извеждане на публикациите на Хабров на върха, дори не знам дали тези алгоритми са били публикувани или не, но за мен е очевидно: ранното минус не позволява на остракизираните публикации да достигнат върха - по-точно забавя стигането до там, което от своя страна значително, в пъти, намалява броя на гледанията.

Доколкото разбирам, няма ефективни начини за борба с това зло. Единственият начин е личното гласуване. Само в този случай можете да установите кои профили периодично проследяват и минус последните публикации. В Хабре обаче няма персонално гласуване (или по-скоро не се оповестява публично).

Но не всичко е толкова просто.

Както казах, разчлененият материал беше публикуван на части. След публикуването на втората част очаквах подобна картина: с първоначалния изход в минус и последващия в плюс. Ефектът обаче се оказа много по-изгладен: публикацията не се превърна в минус.

Към момента на публикуване на втората част грешката беше коригирана, така че данните се дават на ден:

За странностите на хабростатистиката

Не знам откъде дойде изглаждането. Може би защото е публикуван в събота (гласовете против не работят в събота?) или защото това е краят на публикуван преди това материал.

Разпределението на минусите обаче все още е неравномерно: всички минуси се появяват през първата половина на периода на регистрация, а минусът завършва много по-рано от плюса. В същото време гледанията се разпределят за периода точно както последния път - равномерно:

За странностите на хабростатистиката

Скокът, станал около три следобед, не е класифициран материал. Интернетът ми спря за един час. Помощната програма не можа да се свърже със сайта.

За странностите на хабростатистиката

Всичко останало е напълно стандартно.

Отметки:

За странностите на хабростатистиката

Коментари: както миналия път, периодите на активност се редуват с периоди на мълчание.

За странностите на хабростатистиката

Карма. Беше регистрирано увеличение от няколко единици - разбира се, не едновременно:

За странностите на хабростатистиката

И абонати. Общият брой остана непроменен (очевидно желаещите са се записали при публикуването на първата част). Точно около един часа следобед имаше едно колебание: някой се отписа - може би по погрешка - но веднага се записа отново. Ако беше друго лице, настъпи компенсация: общият брой абонати не се промени.

За странностите на хабростатистиката

Така че показателите за публикуване се държат по ясен и предвидим начин. Всички показатели, с изключение на минусите. Тъй като не виждам очевидна причина за това, намирам минус пика за най-малкото странен.

странност 2.
Понякога броят на гледанията намалява (което, разбира се, е невъзможно), но скоро се връща към нормалното.

Проследих го случайно, докато отстранявах грешки в програмата, когато функцията за експортиране и импортиране все още не беше прикачена, така че съответният зигзаг липсва на графиката. Можете да повярвате на думата ми - този ефект е наблюдаван два пъти. Няколко хиляди гледания, внезапно броят гледания намалява с няколкостотин, след 10-20 минути се възстановява до предишното си ниво (без да се взема предвид естественото увеличение).

Това е съвсем просто: грешка в сайта. И няма какво да мислим.

странност 3.
Това ми се стори много по-странно от волунтаристичния първи и техническия втори ефект. Плюсовете не се случват единично, с равномерно разпределение през периода, а на блокове. Но добавянето не е коментар, когато след въпрос естествено следва отговор, те са индивидуален акт!

Погледнете по-отблизо графиките на резултатите, публикувани по-горе: блоковете са забележими.

Знаещи хора ми кимнаха за разпределението на Поасон, но не мога сам да изчисля вероятността. Ако можете, направете сметката. За мен вече е очевидно, че броят на двойните плюсове далеч надхвърля нормата.

Ето цифровите данни за предимствата на първата част на поста. Графиката показва броя на плюсовете за единични, двойни и тройни позиции в общия брой дадени оценки. Както бе споменато по-рано, интервалът на измерване е 10 минути.

За странностите на хабростатистиката

От 30 пробивания в 84 клетки, две клетки бяха пробити три пъти. Е, не знам доколко това отговаря на теорията на вероятностите...

Данни за втората част на публикацията (тъй като периодът на измерване е по-дълъг, съкращавам го според продължителността на първата част, за съпоставимост):

За странностите на хабростатистиката

Между другото, тук един от единичните плюсове е съседен по време на утроения, тоест за около 20 минути имаше скок на плюсове (29% от общия им брой бяха плюсове). И това не се случи в първите минути на публикацията.

Съотношението между единични, двойни и тройни позиции е приблизително същото като при първата част. А намаляването на дела на оценките в измерванията се обяснява с факта, че оценките се дават по-рядко. Направени са измервания, но не са регистрирани предимства.

Не мога да обясня този блок плюс ефект по никакъв начин, тоест изобщо. От гледна точка на минусите, такова „блоково“ поведение не изглежда типично.

Излъчвателите на доброта изпращат ли предложения на групи, включвайки се и изключвайки се? хехехехе...

PS
Ако някой иска да анализира статистиката на публикацията, използвайки по-напреднали методи или да провери аритметиката, файловете с изходните данни са тук:
yadi.sk/d/iN4SL6tzsGEQxw

Не настоявам на съмненията си - може би греша, особено след като статистиката е мрачна. Надявам се, че коментарите на професионални статистици, психолози и други заинтересовани потребители ще изяснят възникналото объркване.

Благодаря ви за вниманието.

Източник: www.habr.com

Добавяне на нов коментар