關於人體統計學的奇怪之處

我以前就注意到收視率的奇怪行為,但最近這種奇怪現象變得太明顯了。 我決定使用我可用的科學方法來研究這個問題,也就是:分析正負的動態。 你是不是突然想到了?

我仍然是一名程式設計師,但我可以做非常基本的事情。 因此,我編寫了一個簡單的實用程序,用於從 Khabrov 帖子​​的面板中收集統計數據:優點、缺點、觀點、書籤等。

關於人體統計學的奇怪之處

統計數據以圖表形式顯示,經過研究,我們發現了更多、更小的驚喜。 但首先要說的是。

奇怪之處1.
這就是我的統計研究真正開始的地方。

對我來說,奇怪的是,在我的一些帖子發表後的最初幾個小時內,它們急劇下降,然後為零,最終獲得了預期的收益。 為什麼會發生這樣的事?

我正要發表另一篇文章 - 分為兩部分。 我決定對他進行統計分析。

發布了第一部分。 同時,我啟動了該實用程式並開始等待結果。 不幸的是,在晚上——當我睡覺時——程序由於一個錯誤而停止收集資訊。 第二天早上我改正了錯誤,但統計結果卻是不到一天。 然而,就工作時間而言,趨勢也很明顯。

數據提供自發布之日起的前 14 小時,測量間隔為 10 分鐘。

關於人體統計學的奇怪之處

眼睛沒有欺騙我們:大多數缺點都發生在該帖子存在的第一個小時。 起初,該帖子陷入負值,然後又恢復了。 以下是用於繪製圖表的數字:

關於人體統計學的奇怪之處

И это при том, что просмотры возрастают плавно!

關於人體統計學的奇怪之處

從第千個值開始的步驟是透過縮寫在哈布羅夫面板中開始的事實來解釋的:沒有地方可以獲得確切的觀看次數(可能可以從第三方服務獲取,但我沒有使用它們) )。

Я в статистике не спец, но ведь подобное распределение минусов анормально, насколько понимаю?!

看,書籤在註冊期間或多或少均勻分佈:

關於人體統計學的奇怪之處

評論也分佈均勻:

關於人體統計學的奇怪之處

活動和被動都有爆發,但它們也分佈在這段時間內:評論要么消失,要么恢復。

訂閱者也是如此——有均勻的小幅增長:

關於人體統計學的奇怪之處

Karma 在報告期間沒有改變——我沒有引用它。 而且評級是由 Habr 計算的,沒有列出來的意義。

所有指標的變化都與瀏覽量成正比,只有缺點才是有問題的:憤怒的爆發發生在發布後的第一個小時內。 我之前的帖子也發生了同樣的事情。 但如果早些時候這些可以說是個人印象,那麼現在它們可以透過註冊得到確認。

在我純粹的新手看來,這樣的分佈意味著:網站上有幾個用戶故意查看最新發布的帖子並對某些帖子投反對票 - 基於只有他們自己知道的需求。 我寫“一些帖子”是因為我不僅在我的出版物中註意到這種影響。 在所有情況下,效果都很明顯,否則我根本不會注意到它。

對於為什麼會發生這種情況,我有四個版本。

版本 1。 精神變態。 有病的人故意監視他們覺得不愉快的作者,並對他們投下反對票,目的是傷害他們。

我不相信這個版本。

版本 2。 心理作用。 哪一個——我不知道。 那麼,為什麼讀者首先一致反對該帖子,然後又一致投票呢? 它們是否因為非主題而受到負面影響,但在美學鑑賞家發現自己佔大多數之後又受到了影響? 我不知道。

如果讀者中有心理學家,請讓他們發表意見。

版本 3。 僕人們正在行動。 為什麼他們的老闆要在哈布羅夫的貼文上散佈腐爛的言論?上帝知道。 然而,不僅僅是我們國家有軍人。 誰會理解他們,俄羅斯恐懼症者?

版本 4。 前面提到的因素的綜合影響。

完全可以想像。

儘管如此,減員還是設法減少了觀看次數。 我不熟悉將哈布羅夫的帖子帶到頂部的規則,我什至不知道這些演算法是否已公開,但對我來說很明顯:早期的減法不允許被排斥的帖子到達頂部 -更準確地說,它延遲了到達目的地的時間,這反過來又大大減少了觀看次數。

據我了解,目前還沒有有效的方法來對抗這種邪惡現象。 唯一的辦法就是個人投票。 只有在這種情況下,您才能確定哪些設定檔正在定期追蹤並減去最新貼文。 然而,哈布雷沒有個人投票(或更確切地說,沒有公開)。

但並非一切都那麼簡單。

正如我所說,剖析的資料是分部分出版的。 第二部分出版後,我預期會出現類似的情況:初始輸出為負值,後續輸出為正值。 然而,結果證明效果要平滑得多:該帖子並沒有變成負號。

到第二部分發佈時,該錯誤已修復,因此每天給出數據:

關於人體統計學的奇怪之處

Откуда взялось сглаживание, мне не известно. Возможно, из-за публикации в субботу (минусаторы по субботам не работают?) или из-за того, что это окончание ранее опубликованного материала.

然而,負值的分佈仍然不均勻:所有負值都發生在註冊期的前半段,且負值的結束時間比正值早得多。 同時,該時段內的觀看次數分佈與上次完全相同 - 均勻:

關於人體統計學的奇怪之處

下午三點左右發生的高峰不屬於機密資料。 我的網路剛剛斷了一個小時。 該實用程式無法連接到該網站。

關於人體統計學的奇怪之處

Все остальное – совершенно стандартно.

書籤:

關於人體統計學的奇怪之處

評論:和上次一樣,活動時期與沉默時期交替出現。

關於人體統計學的奇怪之處

Карма. Зафиксировано увеличение на пару единиц – само собой, не одновременное:

關於人體統計學的奇怪之處

和訂閱者。 總數保持不變(顯然,有興趣的人在第一部分發佈時就報名了)。 就在下午一點左右,出現了一次波動:有人取消訂閱——也許是錯誤的——但立即又重新註冊了。 如果是另一個人,就會發生補償:訂戶總數沒有變化。

關於人體統計學的奇怪之處

因此,發布指標以清晰且可預測的方式表現。 所有指標,除了缺點。 由於我沒有看到明顯的原因,因此我發現負峰值至少很奇怪。

奇怪之處2.
Иногда количество просмотров уменьшается (что, понятное дело, невозможно), но вскоре возвращается в нормальное состояние.

我在調試程式時偶然跟踪了它,當時尚未附加導出導入功能,因此圖表上缺少相應的鋸齒形。 你可以相信我的話——這種效應被觀察到兩次。 幾千個瀏覽量,突然瀏覽量減少了幾百個,10-20分鐘後恢復到之前的水平(不考慮自然增長)。

這很簡單:網站上的一個錯誤。 沒有什麼好考慮的。

奇怪之處3.
在我看來,這比自願的第一效應和技術的第二效應更奇怪。 優點並不是單獨發生,在一段時間內均勻分佈,而是分批發生。 但添加並不是評論,當一個問題自然而然地有一個答案時,它們就是個人行為!

仔細看看上面發布的結果圖:塊是顯而易見的。

Знающие люди кивнули мне на распределение Пуассона, но самостоятельно подсчитать вероятность я не в состоянии. Если вы способны, подсчитывайте. Для меня и без того очевидно, что количество сдвоенных плюсов намного превышает норму.

以下是有關貼文第一部分優點的數字資料。 此圖顯示了給出的評分總數中單位、雙位和三位的優點數。 如前所述,測量間隔為 10 分鐘。

關於人體統計學的奇怪之處

Из 30 тыканий в 84 клетки в две клетки тыкнули трижды. Ну, не знаю, насколько это соответствует теории вероятности…

帖子第二部分的數據(由於測量週期較長,為了便於比較,我根據第一部分的持續時間縮短了它):

關於人體統計學的奇怪之處

順便說一下,這裡的一個正數在時間上與三重正數相鄰,也就是說,在大約 20 分鐘內,正數激增(佔總數的 29% 是正數)。 而這並沒有在發布的最初幾分鐘內發生。

單位、雙位和三位之間的關係與第一部分大致相同。 評級在測量中所佔比例的下降是因為評級頻率降低了。 進行了測量,但沒有記錄到任何優點。

我無法以任何方式解釋這個區塊加效果,也就是說,根本無法解釋。 缺點是,這種「塊狀」行為似乎並不常見。

善良的發射者是否會批量發送建議,打開和關閉? 呵呵呵...

聚苯乙烯
如果有人想使用更高級的方法分析後期統計資料或檢查算術,包含來源資料的檔案位於:
yadi.sk/d/iN4SL6tzsGEQxw

我並不堅持我的懷疑——也許我是錯的,尤其是因為統計數據很黯淡。 我希望專業統計學家、心理學家和其他有興趣的使用者的評論能夠澄清所出現的困惑。

感謝您的關注。

來源: www.habr.com

添加評論