你知道 Habr 有編輯,對嗎?那些是人。多虧了他們,新聞版塊才不空,你總有機會拿遺產開玩笑
每位編輯每週都會出版數十份出版品。有時 Habr 用戶甚至認為他們實際上不是人,而只是用於搜尋和改編材料的演算法。
今天我們將嘗試了解他們的工作日有多長,是否休息以及是否有假期。或者他們畢竟是機器人?至少有一些。關於哈布雷的新偵探故事。這會很有趣。讓我們開始吧!
尋找受害者
要確定哪個 Habr 使用者是編輯者並不困難。他們多產,寫、寫、寫。他們中的一些人寫常規帖子,其他人寫新聞,還有一些人兩者都寫。今天我們重點關注新聞。當我進行初步分析時,可供查看的最新新聞頁面
因此,我們有 92 天的時間,新聞部分發布了 946 個貼文。作者統計如下:
米。 1.新聞出版物統計
220 出版品佔
10天內發布92條以上新聞的名單
由於我們有興趣了解編輯何時工作、何時休息,因此最好的候選人是發表最多文章的人(前三名)。畢竟,我希望他們沒有休息,全天候的工作會背叛任何人。
讓我們假設,將那些已經擔任編輯幾個月的人與那些在哈布雷工作多年的人進行比較是不公平的。或只是閱讀全部 7.3 篇帖子
資料收集
由於我根本不想手動瀏覽所有出版物,因此我使用了自動化方法。一方面,這剝奪了數據收集中那種離我如此之近、總是抓住我的意識的溫暖和輕鬆。另一方面,有些事情告訴我,只要我重新閱讀或至少翻閱我寫過的所有內容,要閱讀的出版物數量可能會增加一倍。
所以。記錄了每位作者的出版物列表,可在 habr(.)com/en/users/username/posts/ 上找到,從第 1 頁到第 20 頁。下一步是下載每份出版物,並將必要的資訊寫入作者出版物的總表中。
取得的訊息
- 出版品編號;
- 日期和時間;
- 名
- 評級(總票數、贊成、反對、最終評級);
- 書籤數量;
- 觀看次數;
- 評論數量。
這個故事中只會使用部分信息,但上傳帖子而不收集所有可以收集的信息是不太合理的。
值得注意的是,從本節開始,所有類型的出版物都被考慮,而不僅僅是新聞。這對於統計的完整性是必要的。
仔細觀察顯示器後,可以發現很多…
Результаты
1地方
讓我們從過去 3 個月最活躍的 Habr 編輯開始。於 26.09.2019 年 XNUMX 月 XNUMX 日註冊,
米。 2. 發表統計
您可能會注意到編輯們有休息日。雖然,顯然不是每週。週末列表可以在劇透下方找到。 U
假期清單
05.10.2019年XNUMX月XNUMX日(星期六);
06.10.2019年XNUMX月XNUMX日(星期日);
12.10.2019年XNUMX月XNUMX日(星期六);
13.10.2019年XNUMX月XNUMX日(星期日);
20.10.2019年XNUMX月XNUMX日(星期日);
02.11.2019年09.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日(星期六 - 星期六);
01.12.2019年XNUMX月XNUMX日(星期日);
07.12.2019/XNUMX/XNUMX(星期六)。
工作時間呢?貼文發佈時間為 07:02 UTC(莫斯科時間 10:02,如果我沒記錯的話,TM 和 Habr 辦公室所在地),一直到 21:59 UTC (00:59)。生產力高峰期為10:00至10:59,8:00之前和19:00之後貼文相當多。
依發表時間(UTC)列出的文章數量
5 (07:00 - 07:59);
25 (08:00 - 08:59);
27 (09:00 - 09:59);
33 (10:00 - 10:59);
26 (11:00 - 11:59);
20 (12:00 - 12:59);
17 (13:00 - 13:59);
24 (14:00 - 14:59);
21 (15:00 - 15:59);
15 (16:00 - 16:59);
13 (17:00 - 17:59);
10 (18:00 - 18:59);
7 (19:00 - 19:59);
5 (20:00 - 20:59);
2 (21:00 - 21:59)。
值得澄清的是,開放時間可能取決於星期幾,因此細節很少。例如,週五 17:43 之後沒有帖子 - 這就是為什麼今天是星期五。但最新的帖子是在周三和周四。擾流板下的詳細資訊。
活動時間 (UTC) 取決於星期幾
08:39 – 18:25(週一);
07:10 – 19:54(星期二);
07:41 - 21:01(週三);
07:02 - 21:59(週四);
08:33 – 17:43(週五);
07:24 - 17:43(週六);
08:36 - 18:27(週日)。
既然我們發現至少一位編輯肯定有週末(甚至是假期?),那麼讓我們繼續討論最重要的問題。它經常引起 Habr 讀者的興趣,並定期在那些最不受歡迎的帖子的評論中進行討論。數量還是品質?編輯有出版品標準嗎?
我的答案是肯定的。為什麼?只要看看每週的出版數量就可以了。令人羨慕的是,這個數字僅在休息期間以及工作第一周(從 20 天到 4 天)才跌破 7 篇。流板下。
每週出版品數量
22 (09.12.2019年14.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
22 (02.12.2019年08.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
22 (25.11.2019年01.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
27 (18.11.2019年24.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
23 (11.11.2019年17.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
3 (04.11.2019年10.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
24 (28.10.2019年03.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
25 (21.10.2019年27.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
26 (14.10.2019年20.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
26 (07.10.2019年13.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
20 (30.09.2019年06.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
10 (26.09.2019年-29.09.2019年)。
2地方
位居第二的是編輯 Anya,在 139 天內發布了 92 個帖子
米。 3. 發表統計
每週發文數從 3 個(僅一次)到 17 個(3 週)不等,平均每週發文數為 9.8 個。
每週出版品數量
12 (09.12.2019年14.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
4 (02.12.2019年08.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
14 (25.11.2019年01.12.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
14 (18.11.2019年24.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
6 (11.11.2019年17.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
10 (04.11.2019年10.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
15 (28.10.2019年03.11.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (21.10.2019年27.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
7 (14.10.2019年20.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
13 (07.10.2019年13.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
17 (30.09.2019年06.10.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (23.09.2019年29.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
7 (16.09.2019年22.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
13 (09.09.2019年15.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
12 (02.09.2019年08.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
4 (26.08.2019年01.09.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (19.08.2019年25.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
17 (12.08.2019年18.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
17 (05.08.2019年11.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
5 (29.07.2019年04.08.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
6 (22.07.2019年28.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
3 (15.07.2019年21.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
8 (08.07.2019年14.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
4 (01.07.2019年07.07.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
13 (24.06.2019年30.06.2019月XNUMX日 - XNUMX年XNUMX月XNUMX日);
10 (20.06.2019年-23.06.2019年)。
關於工作時間,有一個有趣的點。發佈時間從 UTC 時間 3:00 開始,到 22:33 結束。似乎有人做得有點過頭了,但這並不確定。
依發表時間(UTC)列出的文章數量
8 (03:00 - 06:59)
7 (07:00 - 07:59);
15 (08:00 - 08:59);
10 (09:00 - 09:59);
24 (10:00 - 10:59);
30 (11:00 - 11:59);
29 (12:00 - 12:59);
30 (13:00 - 13:59);
23 (14:00 - 14:59);
19 (15:00 - 15:59);
20 (16:00 - 16:59);
14 (17:00 - 17:59);
8 (18:00 - 18:59);
9 (19:00 - 19:59);
6 (20:00 - 20:59);
2 (21:00 - 21:59);
1 (22:00 - 22:59)。
一週中哪一天最長?答案是周五。事實上,不要忘記我忽略了日期,只查看了星期幾。很可能工作日程發生了很大變化。 27.09.2019 年 03 月 00 日 XNUMX:XNUMX 顯然發生了一些有趣的事情。
活動時間 (UTC) 取決於星期幾
07:16 – 19:26(週一);
07:29 – 19:37(星期二);
05:11 - 20:17(週三);
06:00 - 22:33(週四);
03:00 – 20:12(週五);
05:20 - 20:31(週六);
05:00 - 20:11(週日)。
另一個有趣的事實是,這位編輯幾乎從不寫評論。 5 天內有 178 則關於 Habré 的評論。
3地方
今天最終排名第三,3 天內發布了 129 個帖子 -
米。 4. 發表統計
最有成效的一天是星期四,週末的出版數量相當多。工作時間呢?最早發佈時間為 UTC 時間 02:27,最晚發佈時間為 23:25。
這是一個可能被忽視的事實,但事實並非如此。 155 份出版品中有 242 份 (64.5%) 的出版時間可以被 5 分鐘整除(:00、:05、:10 等)。例如,從18:00開始的所有發布都是這樣。這種情況一天會發生很多次。要么有人非常精確(並且有很多空閒時間),要么像往常一樣準備文章,自動化將它們從草稿到出版。
在人工發文的情況下,配對此範本所花費的時間平均為每篇文章 2.5 分鐘,即每 387.5 個貼文約 155 分鐘。
對於其他兩位編輯來說,54 個貼文中的 250 個出現這種準確性(21.6%,
對此,我認為研究發表的時機還不夠有趣。如果不是人幹的,那麼就不會提供任何信息,但如果是人幹的,那麼他就有超能力,什麼也不會被發現。
最著名的 24/7 出版物列表
18:00 - 4 人;
17:50 - 4 人;
17:30 - 4 人;
16:00 - 6 人;
15:10 - 4 人;
08:40 - 4 人;
08:20 - 4 人;
08:00 - 4 人;
06:40 - 4 人;
06:00 - 4 人;
05:50 - 4 人;
等等
白天的活動時間也無法揭示真實的人。
活動時間 (UTC) 取決於星期幾
03:51 – 23:25(週一);
04:00 – 18:30(星期二);
04:18 - 18:20(週三);
02:48 - 23:00(週四);
04:30 – 17:50(週五);
02:27 - 18:50(週六);
04:10 - 16:00(週日)。
他與其他兩位編輯的另一個區別是他有時會寫評論。已出版360篇。
取而代之的是結論
因此,我們了解了 Habr 編輯的工作時間(其中三人是最近最活躍的新聞撰稿人)的大概工作時間,他們有休息日,其中一些人是真正的人,去度假。
我們發現了另一個謎團。或至少是一些可疑的東西。似乎列出的三個之一在自動模式下工作,至少有時是這樣。
也許事實並非如此。但我們有一個偵探。任何事情都可能發生...
讓我們再考慮一下......
這就是今天的全部內容。感謝您的關注!
聚苯乙烯 如果您發現文本中有任何拼寫錯誤或錯誤,請告訴我。 這可以通過選擇文本的一部分並單擊“Ctrl / ⌘ + 輸入“如果你有 Ctrl / ⌘,可以通過
聚苯硫醚 您可能還對我對哈布爾的其他研究感興趣。
其他出版物
來源: www.habr.com