哈布拉偵探:新聞編輯之謎

哈布拉偵探:新聞編輯之謎
你知道 Habr 有編輯,對嗎?那些是人。多虧了他們,新聞版塊才不空,你總有機會拿遺產開玩笑 阿利薩.

每位編輯每週都會出版數十份出版品。有時 Habr 用戶甚至認為他們實際上不是人,而只是用於搜尋和改編材料的演算法。

今天我們將嘗試了解他們的工作日有多長,是否休息以及是否有假期。或者他們畢竟是機器人?至少有一些。關於哈布雷的新偵探故事。這會很有趣。讓我們開始吧!

尋找受害者

要確定哪個 Habr 使用者是編輯者並不困難。他們多產,寫、寫、寫。他們中的一些人寫常規帖子,其他人寫新聞,還有一些人兩者都寫。今天我們重點關注新聞。當我進行初步分析時,可供查看的最新新聞頁面 №50 包含自 03.09.2019 年 3 月 04.09.2019 日起的出版品。現在是 04.12.2019 月,這意味著找到 4 個月的出版物並不困難。為了更好地衡量(不是真的),我選取了從 XNUMX/XNUMX/XNUMX 到 XNUMX/XNUMX/XNUMX 的時間段,因此沒有哪一天僅部分包含在資料中。另外,距離XNUMX月XNUMX日已經過了一整週,我覺得沒有人會真正看這個新聞。因此,他們不會在草稿中編輯/隱藏它們。

因此,我們有 92 天的時間,新聞部分發布了 946 個貼文。作者統計如下:

哈布拉偵探:新聞編輯之謎

米。 1.新聞出版物統計

220 出版品佔 也許_elf, 139 - 安妮布朗森, 129 - 丹尼斯-19, 122 - 分數 和所有 86 - 阿利薩。總計 - 來自 696 位作者的 5 則新聞。他們都沒有隱藏,每個人的個人資料中都清楚地寫著他們為哈布雷工作。另外 6 位作者在 10 天內發表了 92 多篇出版物,其中 19 位作者發表了超過 52 篇出版物。 XNUMX 個帳號發布了一篇新聞文章。

10天內發布92條以上新聞的名單

崔維斯·馬克里夫
列昂尼德_R
巴拉戈勒
k_卡琳娜
瑪麗·阿蒂
IT摘要
擰緊

由於我們有興趣了解編輯何時工作、何時休息,因此最好的候選人是發表最多文章的人(前三名)。畢竟,我希望他們沒有休息,全天候的工作會背叛任何人。

讓我們假設,將那些已經擔任編輯幾個月的人與那些在哈布雷工作多年的人進行比較是不公平的。或只是閱讀全部 7.3 篇帖子 分數 和 8.8 個帖子 阿利薩 我真的不想。所以, 也許_elf, 安妮布朗森 и 丹尼斯-19.

資料收集

由於我根本不想手動瀏覽所有出版物,因此我使用了自動化方法。一方面,這剝奪了數據收集中那種離我如此之近、總是抓住我的意識的溫暖和輕鬆。另一方面,有些事情告訴我,只要我重新閱讀或至少翻閱我寫過的所有內容,要閱讀的出版物數量可能會增加一倍。

所以。記錄了每位作者的出版物列表,可在 habr(.)com/en/users/username/posts/ 上找到,從第 1 頁到第 20 頁。下一步是下載每份出版物,並將必要的資訊寫入作者出版物的總表中。

取得的訊息

  • 出版品編號;
  • 日期和時間;
  • 評級(總票數、贊成、反對、最終評級);
  • 書籤數量;
  • 觀看次數;
  • 評論數量。

這個故事中只會使用部分信息,但上傳帖子而不收集所有可以收集的信息是不太合理的。

值得注意的是,從本節開始,所有類型的出版物都被考慮,而不僅僅是新聞。這對於統計的完整性是必要的。

仔細觀察顯示器後,可以發現很多…

Результаты

1地方

讓我們從過去 3 個月最活躍的 Habr 編輯開始。於 26.09.2019 年 XNUMX 月 XNUMX 日註冊, 也許_elf 我立即開始寫作,但從未寫過一則評論。 6次實現了每天7篇文章的最高生產力,並且有15天沒有發表文章。現在讓我們更詳細地討論一下。

哈布拉偵探:新聞編輯之謎

米。 2. 發表統計 也許_elf

您可能會注意到編輯們有休息日。雖然,顯然不是每週。週末列表可以在劇透下方找到。 U 也許_elf 8月初有3天假期,4天裡還有80個週六、XNUMX個週日免費。你問為什麼要休假而不是病假。週六病假基本上就結束了,週日就直接上班了。

假期清單

05.10.2019年XNUMX月XNUMX日(星期六);
06.10.2019年XNUMX月XNUMX日(星期日);
12.10.2019年XNUMX月XNUMX日(星期六);
13.10.2019年XNUMX月XNUMX日(星期日);
20.10.2019年XNUMX月XNUMX日(星期日);
02.11.2019年09.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日(星期六 - 星期六);
01.12.2019年XNUMX月XNUMX日(星期日);
07.12.2019/XNUMX/XNUMX(星期六)。

工作時間呢?貼文發佈時間為 07:02 UTC(莫斯科時間 10:02,如果我沒記錯的話,TM 和 Habr 辦公室所在地),一直到 21:59 UTC (00:59)。生產力高峰期為10:00至10:59,8:00之前和19:00之後貼文相當多。

依發表時間(UTC)列出的文章數量

5 (07:00 - 07:59);
25 (08:00 - 08:59);
27 (09:00 - 09:59);
33 (10:00 - 10:59);
26 (11:00 - 11:59);
20 (12:00 - 12:59);
17 (13:00 - 13:59);
24 (14:00 - 14:59);
21 (15:00 - 15:59);
15 (16:00 - 16:59);
13 (17:00 - 17:59);
10 (18:00 - 18:59);
7 (19:00 - 19:59);
5 (20:00 - 20:59);
2 (21:00 - 21:59)。

值得澄清的是,開放時間可能取決於星期幾,因此細節很少。例如,週五 17:43 之後沒有帖子 - 這就是為什麼今天是星期五。但最新的帖子是在周三和周四。擾流板下的詳細資訊。

活動時間 (UTC) 取決於星期幾

08:39 – 18:25(週一);
07:10 – 19:54(星期二);
07:41 - 21:01(週三);
07:02 - 21:59(週四);
08:33 – 17:43(週五);
07:24 - 17:43(週六);
08:36 - 18:27(週日)。

既然我們發現至少一位編輯肯定有週末(甚至是假期?),那麼讓我們繼續討論最重要的問題。它經常引起 Habr 讀者的興趣,並定期在那些最不受歡迎的帖子的評論中進行討論。數量還是品質?編輯有出版品標準嗎?

我的答案是肯定的。為什麼?只要看看每週的出版數量就可以了。令人羨慕的是,這個數字僅在休息期間以及工作第一周(從 20 天到 4 天)才跌破 7 篇。流板下。

每週出版品數量

22 (09.12.2019年14.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
22 (02.12.2019年08.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
22 (25.11.2019年01.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
27 (18.11.2019年24.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
23 (11.11.2019年17.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
3 (04.11.2019年10.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
24 (28.10.2019年03.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
25 (21.10.2019年27.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
26 (14.10.2019年20.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
26 (07.10.2019年13.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
20 (30.09.2019年06.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
10 (26.09.2019年-29.09.2019年)。

2地方

位居第二的是編輯 Anya,在 139 天內發布了 92 個帖子 安妮布朗森 (使用者資訊中的名稱)。當 Habr 寫作於 20.06.2019 年 255 月 5 日開始時,她的帳戶上已經有 7 個貼文。每天最多66件(達到178次),效率最高的一天是星期三。 XNUMX 天中有 XNUMX 天沒有發表文章。

哈布拉偵探:新聞編輯之謎

米。 3. 發表統計 安妮布朗森

每週發文數從 3 個(僅一次)到 17 個(3 週)不等,平均每週發文數為 9.8 個。

每週出版品數量

12 (09.12.2019年14.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
4 (02.12.2019年08.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
14 (25.11.2019年01.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
14 (18.11.2019年24.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
6 (11.11.2019年17.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
10 (04.11.2019年10.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
15 (28.10.2019年03.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (21.10.2019年27.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
7 (14.10.2019年20.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
13 (07.10.2019年13.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
17 (30.09.2019年06.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (23.09.2019年29.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
7 (16.09.2019年22.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
13 (09.09.2019年15.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
12 (02.09.2019年08.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
4 (26.08.2019年01.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (19.08.2019年25.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
17 (12.08.2019年18.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
17 (05.08.2019年11.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
5 (29.07.2019年04.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
6 (22.07.2019年28.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
3 (15.07.2019年21.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (08.07.2019年14.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
4 (01.07.2019年07.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
13 (24.06.2019年30.06.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
10 (20.06.2019年-23.06.2019年)。

關於工作時間,有一個有趣的點。發佈時間從 UTC 時間 3:00 開始,到 22:33 結束。似乎有人做得有點過頭了,但這並不確定。

依發表時間(UTC)列出的文章數量

8 (03:00 - 06:59)
7 (07:00 - 07:59);
15 (08:00 - 08:59);
10 (09:00 - 09:59);
24 (10:00 - 10:59);
30 (11:00 - 11:59);
29 (12:00 - 12:59);
30 (13:00 - 13:59);
23 (14:00 - 14:59);
19 (15:00 - 15:59);
20 (16:00 - 16:59);
14 (17:00 - 17:59);
8 (18:00 - 18:59);
9 (19:00 - 19:59);
6 (20:00 - 20:59);
2 (21:00 - 21:59);
1 (22:00 - 22:59)。

一週中哪一天最長?答案是周五。事實上,不要忘記我忽略了日期,只查看了星期幾。很可能工作日程發生了很大變化。 27.09.2019 年 03 月 00 日 XNUMX:XNUMX 顯然發生了一些有趣的事情。

活動時間 (UTC) 取決於星期幾

07:16 – 19:26(週一);
07:29 – 19:37(星期二);
05:11 - 20:17(週三);
06:00 - 22:33(週四);
03:00 – 20:12(週五);
05:20 - 20:31(週六);
05:00 - 20:11(週日)。

另一個有趣的事實是,這位編輯幾乎從不寫評論。 5 天內有 178 則關於 Habré 的評論。

3地方

今天最終排名第三,3 天內發布了 129 個帖子 - 丹尼斯-19。他總共發表了 359 篇出版物,其中一些可以追溯到 2018 年。該用戶什麼時候成為編輯者,或者他從一開始就是編輯者?自01.08.2019年242月1.8日以來,出版品數量急劇增加。此後,共發表了 XNUMX 篇帖子,平均每天 XNUMX 篇。我們假設這是權力的生效日期。所以,統計。

哈布拉偵探:新聞編輯之謎

米。 4. 發表統計 丹尼斯-19

最有成效的一天是星期四,週末的出版數量相當多。工作時間呢?最早發佈時間為 UTC 時間 02:27,最晚發佈時間為 23:25。

這是一個可能被忽視的事實,但事實並非如此。 155 份出版品中有 242 份 (64.5%) 的出版時間可以被 5 分鐘整除(:00、:05、:10 等)。例如,從18:00開始的所有發布都是這樣。這種情況一天會發生很多次。要么有人非常精確(並且有很多空閒時間),要么像往常一樣準備文章,自動化將它們從草稿到出版。

在人工發文的情況下,配對此範本所花費的時間平均為每篇文章 2.5 分鐘,即每 387.5 個貼文約 155 分鐘。

對於其他兩位編輯來說,54 個貼文中的 250 個出現這種準確性(21.6%, 也許_elf)和 54 人中的 255 人(21.2%, 安妮布朗森),對應統計。十進制數字系統有 20% 的理想機會遇到以 0 或 5 結尾的數字。

對此,我認為研究發表的時機還不夠有趣。如果不是人幹的,那麼就不會提供任何信息,但如果是人幹的,那麼他就有超能力,什麼也不會被發現。

最著名的 24/7 出版物列表

18:00 - 4 人;
17:50 - 4 人;
17:30 - 4 人;
16:00 - 6 人;
15:10 - 4 人;
08:40 - 4 人;
08:20 - 4 人;
08:00 - 4 人;
06:40 - 4 人;
06:00 - 4 人;
05:50 - 4 人;
等等

白天的活動時間也無法揭示真實的人。

活動時間 (UTC) 取決於星期幾

03:51 – 23:25(週一);
04:00 – 18:30(星期二);
04:18 - 18:20(週三);
02:48 - 23:00(週四);
04:30 – 17:50(週五);
02:27 - 18:50(週六);
04:10 - 16:00(週日)。

他與其他兩位編輯的另一個區別是他有時會寫評論。已出版360篇。

取而代之的是結論

因此,我們了解了 Habr 編輯的工作時間(其中三人是最近最活躍的新聞撰稿人)的大概工作時間,他們有休息日,其中一些人是真正的人,去度假。

我們發現了另一個謎團。或至少是一些可疑的東西。似乎列出的三個之一在自動模式下工作,至少有時是這樣。

也許事實並非如此。但我們有一個偵探。任何事情都可能發生...

讓我們再考慮一下......

這就是今天的全部內容。感謝您的關注!

聚苯乙烯 如果您發現文本中有任何拼寫錯誤或錯誤,請告訴我。 這可以通過選擇文本的一部分並單擊“Ctrl / ⌘ + 輸入“如果你有 Ctrl / ⌘,可以通過 私人信息. 如果這兩個選項都不可用,請在評論中寫下錯誤。 謝謝你!

聚苯硫醚 您可能還對我對哈布爾的其他研究感興趣。

其他出版物

2019.11.24 — 哈布拉偵探週末
2019.12.04 — 哈布拉偵探和節日氣氛
2019.12.08 — Habr 分析:使用者向 Habr 訂購了什麼禮物

來源: www.habr.com

添加評論