哈布拉侦探:新闻编辑的秘密

哈布拉侦探:新闻编辑的秘密
你知道 Habr 有编辑,对吗?那些是人。多亏了他们,新闻版块才不空,你总有机会拿遗产开玩笑 阿利萨.

每个编辑每周都会出版数十份出版物。有时 Habr 用户甚至认为他们实际上不是人,而只是用于搜索和改编材料的算法。

今天我们将尝试了解他们的工作日有多长,是否休息以及是否有假期。或者也许他们毕竟是机器人?至少有一些。关于哈布雷的新侦探故事。这会很有趣。让我们开始!

寻找受害者

确定哪个 Habr 用户是编辑者并不困难。他们多产,写、写、写。他们中的一些人写常规帖子,另一些人写新闻,还有一些人两者都写。今天我们重点关注新闻。在我进行初步分析时,可供查看的最新新闻页面 №50 包含自 03.09.2019 年 3 月 04.09.2019 日起的出版物。现在是 04.12.2019 月,这意味着找到 4 个月的出版物并不困难。为了更好地衡量(不是真的),我选取了从 XNUMX/XNUMX/XNUMX 到 XNUMX/XNUMX/XNUMX 的时间段,因此没有哪一天仅部分包含在数据中。另外,距离XNUMX月XNUMX日已经过去了一整周,我感觉没有人会真正看这个新闻。因此,他们不会在草稿中编辑/隐藏它们。

因此,我们有 92 天的时间,新闻部分发布了 946 个帖子。作者统计如下:

哈布拉侦探:新闻编辑的秘密

米。 1、新闻出版物统计

220 出版物占 也许_elf, 139 - 安妮·布朗森, 129 - 丹尼斯19, 122 - 分数 和所有 86 - 阿利萨。总计 - 来自 696 位作者的 5 条新闻。他们都没有隐藏,每个人的个人资料中都清楚地写着他们为哈布雷工作。另外 6 位作者在 10 天内发表了 92 多篇出版物,其中 19 位作者发表了超过 52 篇出版物。 XNUMX 个账户发布了一篇新闻文章。

10天内发布92条以上新闻的名单

特拉维斯·马克里夫
列昂尼德_R
巴拉戈
k_卡琳娜
玛丽·阿蒂
IT摘要
shurup

由于我们有兴趣了解编辑何时工作、何时休息,因此最好的候选人是发表最多文章的人(前三名)。毕竟,我希望他们没有休息,全天候的工作会背叛任何人。

让我们假设,将那些已经担任编辑几个月的人与那些在哈布雷工作多年的人进行比较是不公平的。或者只是阅读全部 7.3 篇帖子 分数 和 8.8 个帖子 阿利萨 我真的不想。所以, 也许_elf, 安妮·布朗森 и 丹尼斯19.

数据收集

由于我根本不想手动浏览所有出版物,因此我使用了自动化方法。一方面,这剥夺了数据收集中那种离我如此之近、总是抓住我的意识的温暖和轻松。另一方面,有些事情告诉我,只要我重新阅读或至少翻阅我写过的所有内容,要阅读的出版物数量可能会增加一倍。

所以。记录了每位作者的出版物列表,可在 habr(.)com/en/users/username/posts/ 上找到,从第 1 页到第 20 页。下一步是下载每份出版物,并将必要的信息写入作者出版物的总表中。

获取的信息

  • 出版物编号;
  • 日期和时间;
  • 标题;
  • 评级(总票数、赞成、反对、最终评级);
  • 书签数量;
  • 观看次数;
  • 评论数量。

这个故事中只会使用部分信息,但上传帖子而不收集所有可以收集的信息是不太合理的。

值得注意的是,从本节开始,所有类型的出版物都被考虑,而不仅仅是新闻。这对于统计的完整性是必要的。

仔细观察显示器后,你可以发现很多……

结果

1地方

让我们从过去 3 个月最活跃的 Habr 编辑开始吧。于 26.09.2019 年 XNUMX 月 XNUMX 日注册, 也许_elf 我立即开始写作,但从未写过一条评论。 6次实现了每天7篇文章的最高生产力,并且有15天没有发表文章。现在让我们更详细地讨论一下。

哈布拉侦探:新闻编辑的秘密

米。 2. 发表统计 也许_elf

您可能会注意到编辑们有休息日。虽然,显然不是每周。周末列表可以在剧透下方找到。 U 也许_elf 8月初有3天假期,4天里还有80个周六、XNUMX个周日免费。你问为什么要休假而不是病假。周六病假基本就结束了,周日就直接上班了。

假期清单

05.10.2019年XNUMX月XNUMX日(星期六);
06.10.2019年XNUMX月XNUMX日(星期日);
12.10.2019年XNUMX月XNUMX日(星期六);
13.10.2019年XNUMX月XNUMX日(星期日);
20.10.2019年XNUMX月XNUMX日(星期日);
02.11.2019年09.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日(星期六 - 星期六);
01.12.2019年XNUMX月XNUMX日(星期日);
07.12.2019/XNUMX/XNUMX(星期六)。

工作时间呢?帖子发布时间为 07:02 UTC(莫斯科时间 10:02,如果我没记错的话,TM 和 Habr 办公室所在地),一直到 21:59 UTC (00:59)。生产力高峰期为10:00至10:59,8:00之前和19:00之后帖子相当多。

按发表时间(UTC)列出的文章数量

5 (07:00 - 07:59);
25 (08:00 - 08:59);
27 (09:00 - 09:59);
33 (10:00 - 10:59);
26 (11:00 - 11:59);
20 (12:00 - 12:59);
17 (13:00 - 13:59);
24 (14:00 - 14:59);
21 (15:00 - 15:59);
15 (16:00 - 16:59);
13 (17:00 - 17:59);
10 (18:00 - 18:59);
7 (19:00 - 19:59);
5 (20:00 - 20:59);
2 (21:00 - 21:59)。

值得澄清的是,开放时间可能取决于星期几,因此细节很少。例如,周五 17:43 之后没有帖子 - 这就是为什么今天是周五。但最新的帖子是在周三和周四。扰流板下的详细信息。

活动时间 (UTC) 取决于星期几

08:39 – 18:25(周一);
07:10 – 19:54(星期二);
07:41 - 21:01(周三);
07:02 - 21:59(周四);
08:33 – 17:43(周五);
07:24 - 17:43(周六);
08:36 - 18:27(周日)。

既然我们发现至少一位编辑肯定有周末(甚至假期?),那么让我们继续讨论最重要的问题。它经常引起 Habr 读者的兴趣,并定期在那些最不受欢迎的帖子的评论中进行讨论。数量还是质量?编辑有出版物标准吗?

我的回答是肯定的。为什么?只要看看每周的出版物数量就可以了。令人羡慕的是,这个数字仅在休息期间以及工作第一周(从 20 天到 4 天)才跌破 7 篇。每周平均发表文章数为 23.7 篇,每周详情等你来了解在扰流板下。

每周出版物数量

22 (09.12.2019年14.12.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
22 (02.12.2019年08.12.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
22 (25.11.2019年01.12.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
27 (18.11.2019年24.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
23 (11.11.2019年17.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
3 (04.11.2019年10.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
24 (28.10.2019年03.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
25 (21.10.2019年27.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
26 (14.10.2019年20.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
26 (07.10.2019年13.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
20 (30.09.2019年06.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
10 (26.09.2019年-29.09.2019年)。

2地方

位居第二的是编辑 Anya,在 139 天内发布了 92 个帖子 安妮·布朗森 (用户信息中的名称)。当 Habr 写作于 20.06.2019 年 255 月 5 日开始时,她的帐户上已经有 7 个帖子。每天最多66件(达到178次),效率最高的一天是周三。 XNUMX 天中有 XNUMX 天没有发表文章。

哈布拉侦探:新闻编辑的秘密

米。 3. 发表统计 安妮·布朗森

每周发帖数从 3 个(仅一次)到 17 个(3 周)不等,平均每周发帖数为 9.8 个。

每周出版物数量

12 (09.12.2019年14.12.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
4 (02.12.2019年08.12.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
14 (25.11.2019年01.12.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
14 (18.11.2019年24.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
6 (11.11.2019年17.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
10 (04.11.2019年10.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
15 (28.10.2019年03.11.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
8 (21.10.2019年27.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
7 (14.10.2019年20.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
13 (07.10.2019年13.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
17 (30.09.2019年06.10.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
8 (23.09.2019年29.09.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
7 (16.09.2019年22.09.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
13 (09.09.2019年15.09.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
12 (02.09.2019年08.09.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
4 (26.08.2019年01.09.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
8 (19.08.2019年25.08.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
17 (12.08.2019年18.08.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
17 (05.08.2019年11.08.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
5 (29.07.2019年04.08.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
6 (22.07.2019年28.07.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
3 (15.07.2019年21.07.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
8 (08.07.2019年14.07.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
4 (01.07.2019年07.07.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
13 (24.06.2019年30.06.2019月XNUMX日 – XNUMX年XNUMX月XNUMX日);
10 (20.06.2019年-23.06.2019年)。

关于工作时间,有一个有趣的点。发布时间从 UTC 时间 3:00 开始,到 22:33 结束。似乎有人做得有点过头了,但这并不确定。

按发表时间(UTC)列出的文章数量

8 (03:00 - 06:59)
7 (07:00 - 07:59);
15 (08:00 - 08:59);
10 (09:00 - 09:59);
24 (10:00 - 10:59);
30 (11:00 - 11:59);
29 (12:00 - 12:59);
30 (13:00 - 13:59);
23 (14:00 - 14:59);
19 (15:00 - 15:59);
20 (16:00 - 16:59);
14 (17:00 - 17:59);
8 (18:00 - 18:59);
9 (19:00 - 19:59);
6 (20:00 - 20:59);
2 (21:00 - 21:59);
1 (22:00 - 22:59)。

一周中哪一天最长?答案是星期五。事实上,不要忘记我忽略了日期,只查看了星期几。很可能工作日程发生了很大变化。 27.09.2019 年 03 月 00 日 XNUMX:XNUMX 显然发生了一些有趣的事情。

活动时间 (UTC) 取决于星期几

07:16 – 19:26(周一);
07:29 – 19:37(星期二);
05:11 - 20:17(周三);
06:00 - 22:33(周四);
03:00 – 20:12(周五);
05:20 - 20:31(周六);
05:00 - 20:11(周日)。

另一个有趣的事实是,这位编辑几乎从不写评论。 5 天内有 178 条关于 Habré 的评论。

3地方

今天最终排名第三,3 天内发布了 129 个帖子 - 丹尼斯19。他总共发表了 359 篇出版物,其中一些可以追溯到 2018 年。该用户什么时候成为编辑者,或者他从一开始就是编辑者?自01.08.2019年242月1.8日以来,出版物数量急剧增加。此后,共发表了 XNUMX 篇帖子,平均每天 XNUMX 篇。我们假设这是权力的生效日期。所以,统计。

哈布拉侦探:新闻编辑的秘密

米。 4. 发表统计 丹尼斯19

最富有成效的一天是星期四,周末的出版物数量相当多。工作时间呢?最早发布时间为 UTC 时间 02:27,最晚发布时间为 23:25。

这是一个可能被忽视的事实,但事实并非如此。 155 份出版物中有 242 份 (64.5%) 的出版时间可以被 5 分钟整除(:00、:05、:10 等)。例如,从18:00开始的所有发布都是这样。这种情况一天会发生很多次。要么有人非常精确(并且有很多空闲时间),要么像往常一样准备文章,自动化将它们从草稿到出版。

在人工发帖的情况下,匹配此模板所花费的时间平均为每篇文章 2.5 分钟,即每 387.5 个帖子约 155 分钟。

对于其他两位编辑来说,54 个帖子中的 250 个出现这种准确性(21.6%, 也许_elf)和 54 人中的 255 人(21.2%, 安妮·布朗森),对应于统计。十进制数字系统有 20% 的理想机会遇到以 0 或 5 结尾的数字。

对此,我认为研究发表的时机还不够有趣。如果不是人干的,那么就不会提供任何信息,但如果是人干的,那么他就有超能力,什么也不会被发现。

最著名的 XNUMX/XNUMX 出版物列表

18:00 - 4 人;
17:50 - 4 人;
17:30 - 4 人;
16:00 - 6 人;
15:10 - 4 人;
08:40 - 4 人;
08:20 - 4 人;
08:00 - 4 人;
06:40 - 4 人;
06:00 - 4 人;
05:50 - 4 人;
等等

白天的活动时间也无法揭示真实的人。

活动时间 (UTC) 取决于星期几

03:51 – 23:25(周一);
04:00 – 18:30(星期二);
04:18 - 18:20(周三);
02:48 - 23:00(周四);
04:30 – 17:50(周五);
02:27 - 18:50(周六);
04:10 - 16:00(周日)。

他与其他两位编辑的另一个区别是他有时会写评论。已出版360篇。

取而代之的是结论

因此,我们了解了 Habr 编辑的工作时间(其中三人是最近最活跃的新闻撰稿人)的大概工作时间,他们有休息日,其中一些人是真正的人,去度假。

我们发现了另一个谜团。或者至少是一些可疑的东西。似乎列出的三个之一在自动模式下工作,至少有时是这样。

也许事实并非如此。但我们有一个侦探。任何事情都可能发生...

让我们再考虑一下......

这就是今天的全部内容。感谢您的关注!

PS 如果您在文本中发现任何拼写错误或错误,请告诉我。 这可以通过选择文本的一部分并单击“Ctrl / ⌘ + 输入“如果您有 Ctrl / ⌘,可以通过 私人信息. 如果这两个选项都不可用,请在评论中写下错误。 谢谢你!

聚苯硫醚 您可能还对我对哈布尔的其他研究感兴趣。

其他刊物

2019.11.24 — 哈布拉侦探周末
2019.12.04 — 哈布拉侦探和节日气氛
2019.12.08 — Habr 分析:用户从 Habr 订购了什么礼物

来源: habr.com

添加评论