Žinai, kad Habras turi redaktorių, tiesa? Tie, kurie yra žmonės. Būtent jų dėka naujienų rubrika niekada nebūna tuščia, o apie paveldą visada yra galimybė pajuokauti
Redaktoriai per savaitę išleidžia dešimtis leidinių. Kartais Habr vartotojai netgi mano, kad jie iš tikrųjų nėra žmonės, o paprasčiausiai medžiagų paieškos ir pritaikymo algoritmai.
Šiandien pabandysime išsiaiškinti, kiek ilga jų darbo diena, ar jie apskritai ilsisi ir ar turi atostogų. O gal jie vis dėlto robotai? Bent kai kurie. Nauja detektyvo istorija apie Habré. Bus įdomu. Pradėkime!
Ieškokite aukų
Nustatyti, kuris Habr vartotojas yra redaktorius, nėra sunku. Jie vaisingi ir rašo, rašo, rašo. Vieni iš jų rašo įprastus įrašus, kiti rašo naujienas, treti rašo abu. Šiandien daugiausia dėmesio skirsime naujienoms. Mano pirminės analizės metu buvo galima peržiūrėti naujausių naujienų puslapį
Taigi, turime 92 dienas, per kurias naujienų skiltyje buvo paskelbti 946 įrašai. Autoriaus statistika yra tokia:
Ryžiai. 1. Naujienų leidinių statistika
220 publikacijų apskaityta
Sąrašas tų, kurie per 10 dienas paskelbė daugiau nei 92 naujienų
Kadangi mums įdomu žinoti, kada redaktoriai dirba, o kada ilsisi, geriausi kandidatai yra tie, kurie paskelbė daugiausiai – trys geriausi. Juk tikiuosi, kad jie nesiilsi, o darbas visą parą bet ką išduos.
Tarkime, nesąžininga lyginti tuos, kurie kelis mėnesius dirba redaktoriais, su tais, kurie Habré dirba daugelį metų. Arba tiesiog perskaitykite visus 7.3 tūkst
Duomenų rinkimas
Kadangi nenorėjau daugiau nei iš viso perskaityti visų leidinių rankiniu būdu, taikiau automatizuotus metodus. Viena vertus, tai atėmė iš duomenų rinkimo tą šilumą ir lengvumą, kuris man taip artimas ir visada užvaldo mano sąmonę. Kita vertus, kažkas man sako, kad tol, kol skaitau iš naujo ar bent jau vartysiu viską, ką parašiau, perskaitytų leidinių skaičius gali padvigubėti.
Taigi. Įrašomas kiekvieno autoriaus publikacijų sąrašas, pasiekiamas adresu habr(.)com/en/users/username/posts/ nuo 1 iki 20 puslapių. Kitas žingsnis – atsisiųsti kiekvieną leidinį, o reikiama informacija įrašoma į vieną bendrą autoriaus publikacijų lentelę.
Įgyta informacija
- publikacijos ID;
- data ir laikas;
- pavadinimas;
- reitingas (bendras balsų skaičius, už, prieš, galutinis įvertinimas);
- žymių skaičius;
- peržiūrų skaičius;
- komentarų skaičius.
Šioje istorijoje bus panaudota tik dalis informacijos, tačiau būtų nelabai racionalu kelti įrašus ir nerinkti visko, ką tik gali.
Verta paminėti, kad nuo šio skyriaus atsižvelgiama į visų tipų leidinius, ne tik apie naujienas. Tai būtina statistikos išsamumui užtikrinti.
O atidžiau pažiūrėjus į monitorių galima atrasti daug...
rezultatai
1 vieta
Pradėkime nuo aktyviausio Habr redaktoriaus per pastaruosius 3 mėnesius. Registruojantis 26.09.2019 m. rugsėjo XNUMX d.
Ryžiai. 2. Leidinių statistika
Galite pastebėti, kad redaktoriai turi laisvų dienų. Nors, matyt, ne kiekvieną savaitę. Savaitgalių sąrašą rasite po spoileriu. U
Atostogų sąrašas
05.10.2019-XNUMX-XNUMX (šeštadienis);
06.10.2019-XNUMX-XNUMX (sekmadienis);
12.10.2019-XNUMX-XNUMX (šeštadienis);
13.10.2019-XNUMX-XNUMX (sekmadienis);
20.10.2019-XNUMX-XNUMX (sekmadienis);
02.11.2019-09.11.2019-XNUMX - XNUMX-XNUMX-XNUMX (šeštadienis - šeštadienis);
01.12.2019-XNUMX-XNUMX (sekmadienis);
07.12.2019-XNUMX-XNUMX (šeštadienis).
O darbo valandos? Įrašai skelbiami nuo 07:02 UTC (10:02 Maskvos laiku, kur yra TM ir Habr biuras, jei neklystu) ir iki 21:59 UTC (00:59). Didžiausias produktyvumas yra nuo 10:00 iki 10:59, o iki 8:00 ir po 19:00 yra nemažai pranešimų.
Straipsnių skaičius pagal publikavimo laiką (UTC)
5 (07:00 - 07:59);
25 (08:00 - 08:59);
27 (09:00 - 09:59);
33 (10:00 - 10:59);
26 (11:00 - 11:59);
20 (12:00 - 12:59);
17 (13:00 - 13:59);
24 (14:00 - 14:59);
21 (15:00 - 15:59);
15 (16:00 - 16:59);
13 (17:00 - 17:59);
10 (18:00 - 18:59);
7 (19:00 - 19:59);
5 (20:00 - 20:59);
2 (21:00 - 21:59).
Verta patikslinti, kad darbo laikas tikriausiai priklauso nuo savaitės dienos, todėl smulkmenų mažai. Pavyzdžiui, penktadienį po 17:43 nėra pranešimų – štai kodėl penktadienis. Tačiau naujausi įrašai yra trečiadienį ir ketvirtadienį. Detalės po spoileriu.
Veiklos laikas (UTC), priklausomai nuo savaitės dienos
08:39 – 18:25 (pirmadienis);
07:10 – 19:54 (antradienis);
07:41 - 21:01 (trečiadienis);
07:02 - 21:59 (ketvirtadienis);
08:33 – 17:43 (penktadienis);
07:24 - 17:43 (šeštadienis);
08:36 - 18:27 (sekmadienis).
Kadangi išsiaiškinome, kad bent vienas iš redaktorių tikrai turi savaitgalius (ir net atostogas?), pereikime prie svarbiausio klausimo. Tai dažnai intriguoja Habr skaitytojus ir periodiškai aptarinėjama komentaruose prie tų įrašų, kurie patiko mažiausiai. Kiekis ar kokybė? Ar redaktoriai turi leidinių standartus?
Mano atsakymas yra taip. Kodėl? Tiesiog pažiūrėkite į publikacijų skaičių per savaitę. Su pavydėtinu reguliarumu šis skaičius žemiau 20 nukrito tik poilsio metu, taip pat pirmą darbo savaitę, kuri buvo 4 dienos vietoj 7. Vidutinis publikacijų skaičius per savaitę yra 23.7, o savaitės detalės jūsų laukia po spoileriu.
Publikacijų skaičius per savaitę
22 (09.12.2019 14.12.2019 XNUMX – XNUMX XNUMX XNUMX);
22 (02.12.2019 08.12.2019 XNUMX – XNUMX XNUMX XNUMX);
22 (25.11.2019 01.12.2019 XNUMX – XNUMX XNUMX XNUMX);
27 (18.11.2019 24.11.2019 XNUMX – XNUMX XNUMX XNUMX);
23 (11.11.2019 17.11.2019 XNUMX – XNUMX XNUMX XNUMX);
3 (04.11.2019 10.11.2019 XNUMX – XNUMX XNUMX XNUMX);
24 (28.10.2019 03.11.2019 XNUMX – XNUMX XNUMX XNUMX);
25 (21.10.2019 27.10.2019 XNUMX – XNUMX XNUMX XNUMX);
26 (14.10.2019 20.10.2019 XNUMX – XNUMX XNUMX XNUMX);
26 (07.10.2019 13.10.2019 XNUMX – XNUMX XNUMX XNUMX);
20 (30.09.2019 06.10.2019 XNUMX – XNUMX XNUMX XNUMX);
10 (26.09.2019-29.09.2019).
2 vieta
Antroje vietoje su 139 įrašais per 92 dienas yra redaktorė Anya
Ryžiai. 3. Leidinių statistika
Įrašų skaičius per savaitę svyruoja nuo 3 (tik vieną kartą) iki 17 (3 tokios savaitės), o vidutinis įrašų skaičius yra 9.8 per savaitę.
Publikacijų skaičius per savaitę
12 (09.12.2019 14.12.2019 XNUMX – XNUMX XNUMX XNUMX);
4 (02.12.2019 08.12.2019 XNUMX – XNUMX XNUMX XNUMX);
14 (25.11.2019 01.12.2019 XNUMX – XNUMX XNUMX XNUMX);
14 (18.11.2019 24.11.2019 XNUMX – XNUMX XNUMX XNUMX);
6 (11.11.2019 17.11.2019 XNUMX – XNUMX XNUMX XNUMX);
10 (04.11.2019 10.11.2019 XNUMX – XNUMX XNUMX XNUMX);
15 (28.10.2019 03.11.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (21.10.2019 27.10.2019 XNUMX – XNUMX XNUMX XNUMX);
7 (14.10.2019 20.10.2019 XNUMX – XNUMX XNUMX XNUMX);
13 (07.10.2019 13.10.2019 XNUMX – XNUMX XNUMX XNUMX);
17 (30.09.2019 06.10.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (23.09.2019 29.09.2019 XNUMX – XNUMX XNUMX XNUMX);
7 (16.09.2019 22.09.2019 XNUMX – XNUMX XNUMX XNUMX);
13 (09.09.2019 15.09.2019 XNUMX – XNUMX XNUMX XNUMX);
12 (02.09.2019 08.09.2019 XNUMX – XNUMX XNUMX XNUMX);
4 (26.08.2019 01.09.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (19.08.2019 25.08.2019 XNUMX – XNUMX XNUMX XNUMX);
17 (12.08.2019 18.08.2019 XNUMX – XNUMX XNUMX XNUMX);
17 (05.08.2019 11.08.2019 XNUMX – XNUMX XNUMX XNUMX);
5 (29.07.2019 04.08.2019 XNUMX – XNUMX XNUMX XNUMX);
6 (22.07.2019 28.07.2019 XNUMX – XNUMX XNUMX XNUMX);
3 (15.07.2019 21.07.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (08.07.2019 14.07.2019 XNUMX – XNUMX XNUMX XNUMX);
4 (01.07.2019 07.07.2019 XNUMX – XNUMX XNUMX XNUMX);
13 (24.06.2019 30.06.2019 XNUMX – XNUMX XNUMX XNUMX);
10 (20.06.2019-23.06.2019).
Yra įdomus dalykas apie darbo valandas. Skelbimai prasideda 3:00 UTC ir baigiasi 22:33. Atrodo, kad kažkas šiek tiek persistengė, bet tai nėra tikras.
Straipsnių skaičius pagal publikavimo laiką (UTC)
8 (03:00–06:59)
7 (07:00 - 07:59);
15 (08:00 - 08:59);
10 (09:00 - 09:59);
24 (10:00 - 10:59);
30 (11:00 - 11:59);
29 (12:00 - 12:59);
30 (13:00 - 13:59);
23 (14:00 - 14:59);
19 (15:00 - 15:59);
20 (16:00 - 16:59);
14 (17:00 - 17:59);
8 (18:00 - 18:59);
9 (19:00 - 19:59);
6 (20:00 - 20:59);
2 (21:00 - 21:59);
1 (22:00 - 22:59).
Kuri savaitės diena ilgiausia? Atsakymas yra penktadienis. Tiesą sakant, nepamirškite, kad aš ignoruoju datą ir tiesiog žiūriu į savaitės dieną. Tikėtina, kad tiesiog labai pasikeitė darbo grafikas. O 27.09.2019 m. rugsėjo 03 d. 00:XNUMX akivaizdžiai vyko kažkas įdomaus.
Veiklos laikas (UTC), priklausomai nuo savaitės dienos
07:16 – 19:26 (pirmadienis);
07:29 – 19:37 (antradienis);
05:11 - 20:17 (trečiadienis);
06:00 - 22:33 (ketvirtadienis);
03:00 – 20:12 (penktadienis);
05:20 - 20:31 (šeštadienis);
05:00 - 20:11 (sekmadienis).
Kitas įdomus faktas yra tai, kad šis redaktorius beveik niekada nerašo komentarų. 5 komentarai per 178 dienas apie Habré.
3 vieta
Galutinė 3 vieta šiandien su 129 žinutėmis per 92 dienas -
Ryžiai. 4. Leidinių statistika
Produktyviausia diena – ketvirtadienis, o savaitgalį – gana daug publikacijų. O darbo valandos? Ankstyviausia publikacija yra 02:27 UTC, vėliausia – 23:25.
Faktas, kuris gali likti nepastebėtas, bet ne. 155 iš 242 leidinių (64.5 %) publikuojami iš 5 minučių dalijamu laiku (:00, :05, :10 ir kt.). Pavyzdžiui, visi leidiniai nuo 18:00 yra būtent tokie. Taip nutinka daug kartų per dieną. Arba kažkas yra labai tikslus (ir turi daug laisvo laiko), arba straipsniai ruošiami kaip įprasta, o automatika juos nuneša nuo juodraščių iki publikacijos.
Žmogaus paskelbimo atveju laikas, praleidžiamas atitinkant šį šabloną, vidutiniškai yra 2.5 minutės vienam straipsniui, o tai yra apie 387.5 minutės 155 įrašams.
Kitų dviejų redaktorių atveju šis tikslumas pasitaiko 54 įrašuose iš 250 (21.6 proc.
Šiuo atžvilgiu, manau, nėra pakankamai įdomu tyrinėti publikacijų laiką. Jei jų nepadarys žmogus, tai neduos jokios informacijos, o jei žmogus tai padarys, tai jis turi supergalių ir nieko neišaiškins.
Žymiausių 24/7 leidinių sąrašas
18:00 - 4 vnt;
17:50 - 4 vnt;
17:30 - 4 vnt;
16:00 - 6 vnt;
15:10 - 4 vnt;
08:40 - 4 vnt;
08:20 - 4 vnt;
08:00 - 4 vnt;
06:40 - 4 vnt;
06:00 - 4 vnt;
05:50 - 4 vnt;
ir tt
Veiklos laikas dieną taip pat neatskleidžia tikrojo žmogaus.
Veiklos laikas (UTC), priklausomai nuo savaitės dienos
03:51 – 23:25 (pirmadienis);
04:00 – 18:30 (antradienis);
04:18 - 18:20 (trečiadienis);
02:48 - 23:00 (ketvirtadienis);
04:30 – 17:50 (penktadienis);
02:27 - 18:50 (šeštadienis);
04:10 - 16:00 (sekmadienis).
Iš kitų dviejų redaktorių jį išskiria dar ir tai, kad kartais rašo komentarus. Išleista 360 vnt.
Vietoj išvados
Taigi, išsiaiškinome, kiek apytiksliai dirba „Habr“ redaktoriai (trys iš jų pastaruoju metu aktyviausi naujienų rašytojai), kad jie turi laisvų dienų, o kai kurie iš jų yra tikrai žmonės ir atostogauja.
Ir mes susidūrėme su kita paslaptimi. Arba bent jau kažkas įtartino. Panašu, kad vienas iš trijų išvardintų bent kartais veikia automatiniu režimu.
Galbūt taip nėra. Bet mes turime detektyvą. Visko gali nutikti...
Pamąstykime apie tai dar šiek tiek...
Tai viskas siandienai. Ačiū už dėmesį!
PS Jei tekste radote rašybos klaidų ar klaidų, praneškite man. Tai galima padaryti pasirinkus teksto dalį ir spustelėjus "Ctrl / ⌘ + Enter"jei turite Ctrl / ⌘, arba per
PGS Jus taip pat gali sudominti kiti mano Habr.
Kiti leidiniai
Šaltinis: www.habr.com