关于人体统计学的奇怪之处

我以前就注意到收视率的奇怪行为,但最近这种奇怪现象变得太明显了。我决定使用我可用的科学方法来研究这个问题,即:分析正负的动态。你是不是突然想到了?

我仍然是一名程序员,但我可以做非常基本的事情。因此,我编写了一个简单的实用程序,用于从 Khabrov 帖子​​的面板中收集统计数据:优点、缺点、观点、书签等。

关于人体统计学的奇怪之处

统计数据以图表形式显示,经过研究,我们发现了更多、更小的惊喜。但首先要说的是。

奇怪之处1.
这就是我的统计研究真正开始的地方。

对我来说,奇怪的是,在我的一些帖子发表后的最初几个小时内,它们急剧下降,然后为零,最终获得了预期的收益。为什么会发生这样的事?

我正要发表另一篇文章 - 分为两部分。我决定对他进行统计分析。

发布了第一部分。与此同时,我启动了该实用程序并开始等待结果。不幸的是,在晚上——当我睡觉时——程序由于一个错误而停止收集信息。第二天早上我改正了错误,但统计结果却是不到一天。然而,就工作时间而言,趋势也很明显。

数据提供自发布之日起的前 14 小时,测量间隔为 10 分钟。

关于人体统计学的奇怪之处

眼睛没有欺骗我们:大多数缺点都发生在该帖子存在的第一个小时内。起初,该帖子陷入负值,然后又恢复了。以下是用于绘制图表的数字:

关于人体统计学的奇怪之处

尽管观看次数正在顺利增加!

关于人体统计学的奇怪之处

从第千个值开始的步骤是通过缩写在 Khabrov 面板中开始的事实来解释的:没有地方可以获取确切的观看次数(可能可以从第三方服务获取,但我没有使用它们) )。

我不是统计学专家,但据我了解,这样的负数分布是不正常的?!

看,书签在注册期间或多或少均匀分布:

关于人体统计学的奇怪之处

评论也分布均匀:

关于人体统计学的奇怪之处

活动和被动都有爆发,但它们也分布在这段时间内:评论要么消失,要么恢复。

订阅者也是如此——有均匀的小幅增长:

关于人体统计学的奇怪之处

Karma 在报告期间没有改变——我没有引用它。而且评级是由 Habr 计算的,没有列出来的意义。

所有指标的变化都与浏览量成正比,只有缺点才是有问题的:愤怒的爆发发生在发布后的第一个小时内。我之前的帖子也发生了同样的事情。但如果早些时候这些可以说是个人印象,那么现在它们可以通过注册得到确认。

在我纯粹的新手看来,这样的分布意味着:网站上有几个用户故意查看最新发布的帖子并对某些帖子投反对票 - 基于只有他们自己知道的需求。我写“一些帖子”是因为我不仅在我的出版物中注意到这种影响。在所有情况下,效果都很明显,否则我根本不会注意到它。

对于为什么会发生这种情况,我有四个版本。

1版本。 精神变态。有病的人故意监视他们觉得不愉快的作者,并对他们投反对票,目的是伤害他们。

我不相信这个版本。

2版本。 心理作用。哪一个——我不知道。那么,为什么读者首先一致反对该帖子,然后又一致投票呢?它们是否因为非主题而受到负面影响,但在审美鉴赏家发现自己占大多数之后又受到了影响?我不知道。

如果读者中有心理学家,请让他们发表意见。

3版本。 仆人们正在行动。为什么他们的老板要在哈布罗夫的帖子上散布腐烂的言论?上帝知道。然而,不仅仅是我们国家有军人。谁会理解他们,俄罗斯恐惧症者?

4版本。 前面提到的因素的综合影响。

完全可以想象。

尽管如此,减员还是设法减少了观看次数。我不熟悉将哈布罗夫的帖子带到顶部的规则,我什至不知道这些算法是否已公开,但对我来说很明显:早期的减法不允许被排斥的帖子到达顶部 -更准确地说,它延迟了到达目的地的时间,这反过来又大大减少了观看次数。

据我了解,目前还没有有效的方法来对抗这种邪恶现象。唯一的办法就是个人投票。只有在这种情况下,您才能确定哪些配置文件正在定期跟踪并减去最新帖子。然而,哈布雷没有个人投票(或者更确切地说,没有公开)。

但它不是那么简单。

正如我所说,剖析的材料是分部分出版的。第二部分出版后,我期望出现类似的情况:初始输出为负值,后续输出为正值。然而,结果证明效果要平滑得多:该帖子并没有变成负号。

到第二部分发布时,该错误已得到修复,因此每天给出数据:

关于人体统计学的奇怪之处

我不知道平滑从何而来。也许是因为它是在周六发布的(周六不起作用?)或者因为这是之前发布的材料的结尾。

然而,负值的分布仍然不均匀:所有负值都发生在注册期的前半段,并且负值的结束时间比正值早得多。与此同时,该时段内的观看次数分布与上次完全相同 - 均匀:

关于人体统计学的奇怪之处

下午三点左右发生的峰值不属于机密材料。我的网络刚刚断了一个小时。该实用程序无法连接到该站点。

关于人体统计学的奇怪之处

其他一切都是完全标准的。

书签:

关于人体统计学的奇怪之处

评论:和上次一样,活动时期与沉默时期交替出现。

关于人体统计学的奇怪之处

业力。记录了几个单位的增加 - 当然,不是同时增加的:

关于人体统计学的奇怪之处

和订阅者。总数保持不变(显然,有兴趣的人在第一部分发布时就报名了)。就在下午一点左右,出现了一次波动:有人取消订阅——也许是错误的——但立即又重新注册了。如果是另一个人,就会发生补偿:订户总数没有变化。

关于人体统计学的奇怪之处

因此,发布指标以清晰且可预测的方式表现。所有指标,除了缺点。由于我没有看到明显的原因,因此我发现负峰值至少很奇怪。

奇怪之处2.
有时观看次数会减少(当然这是不可能的),但很快就会恢复正常。

我在调试程序时偶然跟踪了它,当时尚未附加导出导入功能,因此图表上缺少相应的锯齿形。你可以相信我的话——这种效应被观察到两次。几千个浏览量,突然浏览量减少了几百个,10-20分钟后恢复到之前的水平(不考虑自然增长)。

这很简单:网站上的一个错误。没有什么可考虑的。

奇怪之处3.
在我看来,这比自愿的第一效应和技术的第二效应更奇怪。优点并不是单独发生,在一段时间内均匀分布,而是分批发生。但添加并不是评论,当一个问题自然而然地有一个答案时,它们就是个人行为!

仔细看看上面发布的结果图:块是显而易见的。

有知识的人向我点头同意泊松分布,但我无法自己计算概率。如果你可以的话,做一下数学。对我来说已经很明显,双加的数量远远超出了正常水平。

以下是有关帖子第一部分优点的数字数据。该图显示了给出的评分总数中单位、双位和三位的优点数。如前所述,测量间隔为 10 分钟。

关于人体统计学的奇怪之处

在 30 个单元格的 84 次戳中,有两个单元格被戳了 XNUMX 次。好吧,我不知道这与概率论有多少对应……

帖子第二部分的数据(由于测量周期较长,为了便于比较,我根据第一部分的持续时间缩短了它):

关于人体统计学的奇怪之处

顺便说一下,这里的一个正数在时间上与三重正数相邻,也就是说,在大约 20 分钟内,正数激增(占总数的 29% 是正数)。而这并没有在发布的最初几分钟内发生。

单位、双位和三位之间的关系与第一部分大致相同。评级在测量中所占比例的下降是因为评级频率降低了。进行了测量,但没有记录到任何优点。

我无法以任何方式解释这个块加效果,也就是说,根本无法解释。缺点是,这种“块状”行为似乎并不常见。

善良的发射者是否会批量发送建议,打开和关闭?呵呵呵呵...

PS
如果有人想使用更高级的方法分析后期统计数据或检查算术,包含源数据的文件位于:
yadi.sk/d/iN4SL6tzsGEQxw

我并不坚持我的怀疑——也许我是错的,尤其是因为统计数据很黯淡。我希望专业统计学家、心理学家和其他感兴趣的用户的评论能够澄清所出现的困惑。

感谢您的关注。

来源: habr.com

添加评论