Habra detektyvas: naujienų redaktorių paslaptis

Habra detektyvas: naujienų redaktorių paslaptis
Žinai, kad Habras turi redaktorių, tiesa? Tie, kurie yra žmonės. Būtent jų dėka naujienų rubrika niekada nebūna tuščia, o apie paveldą visada yra galimybė pajuokauti alizar.

Redaktoriai per savaitę išleidžia dešimtis leidinių. Kartais Habr vartotojai netgi mano, kad jie iš tikrųjų nėra žmonės, o paprasčiausiai medžiagų paieškos ir pritaikymo algoritmai.

Šiandien pabandysime išsiaiškinti, kiek ilga jų darbo diena, ar jie apskritai ilsisi ir ar turi atostogų. O gal jie vis dėlto robotai? Bent kai kurie. Nauja detektyvo istorija apie Habré. Bus įdomu. Pradėkime!

Ieškokite aukų

Nustatyti, kuris Habr vartotojas yra redaktorius, nėra sunku. Jie vaisingi ir rašo, rašo, rašo. Vieni iš jų rašo įprastus įrašus, kiti rašo naujienas, treti rašo abu. Šiandien daugiausia dėmesio skirsime naujienoms. Mano pirminės analizės metu buvo galima peržiūrėti naujausių naujienų puslapį № 50 buvo publikacijų nuo 03.09.2019-3-04.09.2019. Dabar gruodis, o tai reiškia, kad nėra sunku rasti leidinių 04.12.2019 mėnesiams. Gerai (nelabai) paėmiau laikotarpį nuo 4-XNUMX-XNUMX iki XNUMX-XNUMX-XNUMX, kad nė viena diena į duomenis nebuvo įtraukta tik iš dalies. Be to, nuo gruodžio XNUMX dienos jau praėjo visa savaitė ir kažkas man sako, kad šios naujienos tikrai niekas neskaitys. Ir atitinkamai jie neredaguos / neslėps jų juodraščiuose.

Taigi, turime 92 dienas, per kurias naujienų skiltyje buvo paskelbti 946 įrašai. Autoriaus statistika yra tokia:

Habra detektyvas: naujienų redaktorių paslaptis

Ryžiai. 1. Naujienų leidinių statistika

220 publikacijų apskaityta gal_elfas, 139 - Annie Bronson, 129 - denis-19, 122 - ženklai ir viskas 86 - alizar. Iš viso – 696 naujienos iš 5 autorių. Nė vienas iš jų nesislapsto ir kiekvieno profilyje aiškiai parašyta, kad jie dirba Habré. Dar 6 autoriai per 10 dienas parašė daugiau nei 92 publikacijų, o 19 – ne vieną. Vienas naujienų įrašas buvo paskelbtas 52 paskyrose.

Sąrašas tų, kurie per 10 dienas paskelbė daugiau nei 92 naujienų

Travis_Macrif
Leonidas_R
baragol
k_karina
mary_arti
ITSumma
varžtas

Kadangi mums įdomu žinoti, kada redaktoriai dirba, o kada ilsisi, geriausi kandidatai yra tie, kurie paskelbė daugiausiai – trys geriausi. Juk tikiuosi, kad jie nesiilsi, o darbas visą parą bet ką išduos.

Tarkime, nesąžininga lyginti tuos, kurie kelis mėnesius dirba redaktoriais, su tais, kurie Habré dirba daugelį metų. Arba tiesiog perskaitykite visus 7.3 tūkst ženklai ir 8.8 tūkst alizar Aš tikrai nenoriu. Taigi, gal_elfas, Annie Bronson и denis-19.

Duomenų rinkimas

Kadangi nenorėjau daugiau nei iš viso perskaityti visų leidinių rankiniu būdu, taikiau automatizuotus metodus. Viena vertus, tai atėmė iš duomenų rinkimo tą šilumą ir lengvumą, kuris man taip artimas ir visada užvaldo mano sąmonę. Kita vertus, kažkas man sako, kad tol, kol skaitau iš naujo ar bent jau vartysiu viską, ką parašiau, perskaitytų leidinių skaičius gali padvigubėti.

Taigi. Įrašomas kiekvieno autoriaus publikacijų sąrašas, pasiekiamas adresu habr(.)com/en/users/username/posts/ nuo 1 iki 20 puslapių. Kitas žingsnis – atsisiųsti kiekvieną leidinį, o reikiama informacija įrašoma į vieną bendrą autoriaus publikacijų lentelę.

Įgyta informacija

  • publikacijos ID;
  • data ir laikas;
  • pavadinimas;
  • reitingas (bendras balsų skaičius, už, prieš, galutinis įvertinimas);
  • žymių skaičius;
  • peržiūrų skaičius;
  • komentarų skaičius.

Šioje istorijoje bus panaudota tik dalis informacijos, tačiau būtų nelabai racionalu kelti įrašus ir nerinkti visko, ką tik gali.

Verta paminėti, kad nuo šio skyriaus atsižvelgiama į visų tipų leidinius, ne tik apie naujienas. Tai būtina statistikos išsamumui užtikrinti.

O atidžiau pažiūrėjus į monitorių galima atrasti daug...

rezultatai

1 vieta

Pradėkime nuo aktyviausio Habr redaktoriaus per pastaruosius 3 mėnesius. Registruojantis 26.09.2019 m. rugsėjo XNUMX d. gal_elfas Iš karto pradėjau rašyti, bet neparašiau nė vieno komentaro. Maksimalus 6 publikacijų per dieną produktyvumas pasiektas 7 kartus, o publikacijų nebuvo 15 dienų. Dabar pakalbėkime išsamiau.

Habra detektyvas: naujienų redaktorių paslaptis

Ryžiai. 2. Leidinių statistika gal_elfas

Galite pastebėti, kad redaktoriai turi laisvų dienų. Nors, matyt, ne kiekvieną savaitę. Savaitgalių sąrašą rasite po spoileriu. U gal_elfas lapkričio pradžioje buvo 8 dienų atostogos, taip pat 3 laisvi šeštadieniai ir 4 sekmadieniai per 80 dienų. Kodėl atostogos, o ne nedarbingumo atostogos, klausiate. Šeštadienį nedarbingumo atostogos vargu ar baigtųsi, o sekmadienį eitų tiesiai į darbą.

Atostogų sąrašas

05.10.2019-XNUMX-XNUMX (šeštadienis);
06.10.2019-XNUMX-XNUMX (sekmadienis);
12.10.2019-XNUMX-XNUMX (šeštadienis);
13.10.2019-XNUMX-XNUMX (sekmadienis);
20.10.2019-XNUMX-XNUMX (sekmadienis);
02.11.2019-09.11.2019-XNUMX - XNUMX-XNUMX-XNUMX (šeštadienis - šeštadienis);
01.12.2019-XNUMX-XNUMX (sekmadienis);
07.12.2019-XNUMX-XNUMX (šeštadienis).

O darbo valandos? Įrašai skelbiami nuo 07:02 UTC (10:02 Maskvos laiku, kur yra TM ir Habr biuras, jei neklystu) ir iki 21:59 UTC (00:59). Didžiausias produktyvumas yra nuo 10:00 iki 10:59, o iki 8:00 ir po 19:00 yra nemažai pranešimų.

Straipsnių skaičius pagal publikavimo laiką (UTC)

5 (07:00 - 07:59);
25 (08:00 - 08:59);
27 (09:00 - 09:59);
33 (10:00 - 10:59);
26 (11:00 - 11:59);
20 (12:00 - 12:59);
17 (13:00 - 13:59);
24 (14:00 - 14:59);
21 (15:00 - 15:59);
15 (16:00 - 16:59);
13 (17:00 - 17:59);
10 (18:00 - 18:59);
7 (19:00 - 19:59);
5 (20:00 - 20:59);
2 (21:00 - 21:59).

Verta patikslinti, kad darbo laikas tikriausiai priklauso nuo savaitės dienos, todėl smulkmenų mažai. Pavyzdžiui, penktadienį po 17:43 nėra pranešimų – štai kodėl penktadienis. Tačiau naujausi įrašai yra trečiadienį ir ketvirtadienį. Detalės po spoileriu.

Veiklos laikas (UTC), priklausomai nuo savaitės dienos

08:39 – 18:25 (pirmadienis);
07:10 – 19:54 (antradienis);
07:41 - 21:01 (trečiadienis);
07:02 - 21:59 (ketvirtadienis);
08:33 – 17:43 (penktadienis);
07:24 - 17:43 (šeštadienis);
08:36 - 18:27 (sekmadienis).

Kadangi išsiaiškinome, kad bent vienas iš redaktorių tikrai turi savaitgalius (ir net atostogas?), pereikime prie svarbiausio klausimo. Tai dažnai intriguoja Habr skaitytojus ir periodiškai aptarinėjama komentaruose prie tų įrašų, kurie patiko mažiausiai. Kiekis ar kokybė? Ar redaktoriai turi leidinių standartus?

Mano atsakymas yra taip. Kodėl? Tiesiog pažiūrėkite į publikacijų skaičių per savaitę. Su pavydėtinu reguliarumu šis skaičius žemiau 20 nukrito tik poilsio metu, taip pat pirmą darbo savaitę, kuri buvo 4 dienos vietoj 7. Vidutinis publikacijų skaičius per savaitę yra 23.7, o savaitės detalės jūsų laukia po spoileriu.

Publikacijų skaičius per savaitę

22 (09.12.2019 14.12.2019 XNUMX – XNUMX XNUMX XNUMX);
22 (02.12.2019 08.12.2019 XNUMX – XNUMX XNUMX XNUMX);
22 (25.11.2019 01.12.2019 XNUMX – XNUMX XNUMX XNUMX);
27 (18.11.2019 24.11.2019 XNUMX – XNUMX XNUMX XNUMX);
23 (11.11.2019 17.11.2019 XNUMX – XNUMX XNUMX XNUMX);
3 (04.11.2019 10.11.2019 XNUMX – XNUMX XNUMX XNUMX);
24 (28.10.2019 03.11.2019 XNUMX – XNUMX XNUMX XNUMX);
25 (21.10.2019 27.10.2019 XNUMX – XNUMX XNUMX XNUMX);
26 (14.10.2019 20.10.2019 XNUMX – XNUMX XNUMX XNUMX);
26 (07.10.2019 13.10.2019 XNUMX – XNUMX XNUMX XNUMX);
20 (30.09.2019 06.10.2019 XNUMX – XNUMX XNUMX XNUMX);
10 (26.09.2019-29.09.2019).

2 vieta

Antroje vietoje su 139 įrašais per 92 dienas yra redaktorė Anya Annie Bronson (vardas iš vartotojo informacijos). Kai 20.06.2019 m. birželio 255 d. prasidėjo Habr rašymas, jos paskyroje jau buvo 5 įrašai. Didžiausia per dieną – 7 vienetai (pasiekiama 66 kartus), o produktyviausia diena – trečiadienis. 178 dienos iš XNUMX buvo be publikacijų.

Habra detektyvas: naujienų redaktorių paslaptis

Ryžiai. 3. Leidinių statistika Annie Bronson

Įrašų skaičius per savaitę svyruoja nuo 3 (tik vieną kartą) iki 17 (3 tokios savaitės), o vidutinis įrašų skaičius yra 9.8 per savaitę.

Publikacijų skaičius per savaitę

12 (09.12.2019 14.12.2019 XNUMX – XNUMX XNUMX XNUMX);
4 (02.12.2019 08.12.2019 XNUMX – XNUMX XNUMX XNUMX);
14 (25.11.2019 01.12.2019 XNUMX – XNUMX XNUMX XNUMX);
14 (18.11.2019 24.11.2019 XNUMX – XNUMX XNUMX XNUMX);
6 (11.11.2019 17.11.2019 XNUMX – XNUMX XNUMX XNUMX);
10 (04.11.2019 10.11.2019 XNUMX – XNUMX XNUMX XNUMX);
15 (28.10.2019 03.11.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (21.10.2019 27.10.2019 XNUMX – XNUMX XNUMX XNUMX);
7 (14.10.2019 20.10.2019 XNUMX – XNUMX XNUMX XNUMX);
13 (07.10.2019 13.10.2019 XNUMX – XNUMX XNUMX XNUMX);
17 (30.09.2019 06.10.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (23.09.2019 29.09.2019 XNUMX – XNUMX XNUMX XNUMX);
7 (16.09.2019 22.09.2019 XNUMX – XNUMX XNUMX XNUMX);
13 (09.09.2019 15.09.2019 XNUMX – XNUMX XNUMX XNUMX);
12 (02.09.2019 08.09.2019 XNUMX – XNUMX XNUMX XNUMX);
4 (26.08.2019 01.09.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (19.08.2019 25.08.2019 XNUMX – XNUMX XNUMX XNUMX);
17 (12.08.2019 18.08.2019 XNUMX – XNUMX XNUMX XNUMX);
17 (05.08.2019 11.08.2019 XNUMX – XNUMX XNUMX XNUMX);
5 (29.07.2019 04.08.2019 XNUMX – XNUMX XNUMX XNUMX);
6 (22.07.2019 28.07.2019 XNUMX – XNUMX XNUMX XNUMX);
3 (15.07.2019 21.07.2019 XNUMX – XNUMX XNUMX XNUMX);
8 (08.07.2019 14.07.2019 XNUMX – XNUMX XNUMX XNUMX);
4 (01.07.2019 07.07.2019 XNUMX – XNUMX XNUMX XNUMX);
13 (24.06.2019 30.06.2019 XNUMX – XNUMX XNUMX XNUMX);
10 (20.06.2019-23.06.2019).

Yra įdomus dalykas apie darbo valandas. Skelbimai prasideda 3:00 UTC ir baigiasi 22:33. Atrodo, kad kažkas šiek tiek persistengė, bet tai nėra tikras.

Straipsnių skaičius pagal publikavimo laiką (UTC)

8 (03:00–06:59)
7 (07:00 - 07:59);
15 (08:00 - 08:59);
10 (09:00 - 09:59);
24 (10:00 - 10:59);
30 (11:00 - 11:59);
29 (12:00 - 12:59);
30 (13:00 - 13:59);
23 (14:00 - 14:59);
19 (15:00 - 15:59);
20 (16:00 - 16:59);
14 (17:00 - 17:59);
8 (18:00 - 18:59);
9 (19:00 - 19:59);
6 (20:00 - 20:59);
2 (21:00 - 21:59);
1 (22:00 - 22:59).

Kuri savaitės diena ilgiausia? Atsakymas yra penktadienis. Tiesą sakant, nepamirškite, kad aš ignoruoju datą ir tiesiog žiūriu į savaitės dieną. Tikėtina, kad tiesiog labai pasikeitė darbo grafikas. O 27.09.2019 m. rugsėjo 03 d. 00:XNUMX akivaizdžiai vyko kažkas įdomaus.

Veiklos laikas (UTC), priklausomai nuo savaitės dienos

07:16 – 19:26 (pirmadienis);
07:29 – 19:37 (antradienis);
05:11 - 20:17 (trečiadienis);
06:00 - 22:33 (ketvirtadienis);
03:00 – 20:12 (penktadienis);
05:20 - 20:31 (šeštadienis);
05:00 - 20:11 (sekmadienis).

Kitas įdomus faktas yra tai, kad šis redaktorius beveik niekada nerašo komentarų. 5 komentarai per 178 dienas apie Habré.

3 vieta

Galutinė 3 vieta šiandien su 129 žinutėmis per 92 dienas - denis-19. Iš viso jis turi 359 publikacijas, kai kurios iš jų datuojamos 2018 m. Kada šis vartotojas tapo redaktoriumi ar juo buvo nuo pat pradžių? Publikacijų skaičius smarkiai išaugo nuo 01.08.2019-242-1.8. Nuo to laiko buvo parašyti XNUMX pranešimai, vidutiniškai po XNUMX per dieną. Tarkime, kad tai buvo įgaliojimų įsigaliojimo data. Taigi, statistika.

Habra detektyvas: naujienų redaktorių paslaptis

Ryžiai. 4. Leidinių statistika denis-19

Produktyviausia diena – ketvirtadienis, o savaitgalį – gana daug publikacijų. O darbo valandos? Ankstyviausia publikacija yra 02:27 UTC, vėliausia – 23:25.

Faktas, kuris gali likti nepastebėtas, bet ne. 155 iš 242 leidinių (64.5 %) publikuojami iš 5 minučių dalijamu laiku (:00, :05, :10 ir kt.). Pavyzdžiui, visi leidiniai nuo 18:00 yra būtent tokie. Taip nutinka daug kartų per dieną. Arba kažkas yra labai tikslus (ir turi daug laisvo laiko), arba straipsniai ruošiami kaip įprasta, o automatika juos nuneša nuo juodraščių iki publikacijos.

Žmogaus paskelbimo atveju laikas, praleidžiamas atitinkant šį šabloną, vidutiniškai yra 2.5 minutės vienam straipsniui, o tai yra apie 387.5 minutės 155 įrašams.

Kitų dviejų redaktorių atveju šis tikslumas pasitaiko 54 įrašuose iš 250 (21.6 proc. gal_elfas) ir 54 iš 255 (21.2 proc. Annie Bronson), kas atitinka statistiką. Dešimtainių skaičių sistema turi 20 % idealią galimybę sutikti skaičių, kuris baigiasi 0 arba 5.

Šiuo atžvilgiu, manau, nėra pakankamai įdomu tyrinėti publikacijų laiką. Jei jų nepadarys žmogus, tai neduos jokios informacijos, o jei žmogus tai padarys, tai jis turi supergalių ir nieko neišaiškins.

Žymiausių 24/7 leidinių sąrašas

18:00 - 4 vnt;
17:50 - 4 vnt;
17:30 - 4 vnt;
16:00 - 6 vnt;
15:10 - 4 vnt;
08:40 - 4 vnt;
08:20 - 4 vnt;
08:00 - 4 vnt;
06:40 - 4 vnt;
06:00 - 4 vnt;
05:50 - 4 vnt;
ir tt

Veiklos laikas dieną taip pat neatskleidžia tikrojo žmogaus.

Veiklos laikas (UTC), priklausomai nuo savaitės dienos

03:51 – 23:25 (pirmadienis);
04:00 – 18:30 (antradienis);
04:18 - 18:20 (trečiadienis);
02:48 - 23:00 (ketvirtadienis);
04:30 – 17:50 (penktadienis);
02:27 - 18:50 (šeštadienis);
04:10 - 16:00 (sekmadienis).

Iš kitų dviejų redaktorių jį išskiria dar ir tai, kad kartais rašo komentarus. Išleista 360 vnt.

Vietoj išvados

Taigi, išsiaiškinome, kiek apytiksliai dirba „Habr“ redaktoriai (trys iš jų pastaruoju metu aktyviausi naujienų rašytojai), kad jie turi laisvų dienų, o kai kurie iš jų yra tikrai žmonės ir atostogauja.

Ir mes susidūrėme su kita paslaptimi. Arba bent jau kažkas įtartino. Panašu, kad vienas iš trijų išvardintų bent kartais veikia automatiniu režimu.

Galbūt taip nėra. Bet mes turime detektyvą. Visko gali nutikti...

Pamąstykime apie tai dar šiek tiek...

Tai viskas siandienai. Ačiū už dėmesį!

PS Jei tekste radote rašybos klaidų ar klaidų, praneškite man. Tai galima padaryti pasirinkus teksto dalį ir spustelėjus "Ctrl / ⌘ + Enter"jei turite Ctrl / ⌘, arba per asmenines žinutes. Jei abiejų variantų nėra, apie klaidas parašykite komentaruose. Ačiū!

PGS Jus taip pat gali sudominti kiti mano Habr.

Kiti leidiniai

2019.11.24 — Habra detektyvas savaitgalį
2019.12.04 — Habra detektyvas ir šventinė nuotaika
2019.12.08 — Habr analizė: ką vartotojai užsako dovanų iš Habr

Šaltinis: www.habr.com

Добавить комментарий