Detetive Habra: o mistério dos editores de notícias

Detetive Habra: o mistério dos editores de notícias
Você sabe que Habr tem editores, certo? Aqueles que são pessoas. É graças a eles que a secção de notícias nunca fica vazia e você sempre tem a oportunidade de brincar sobre o patrimônio alizar.

Os editores produzem dezenas de publicações por semana cada. Às vezes, os usuários do Habr até presumem que não são realmente pessoas, mas simplesmente algoritmos para busca e adaptação de materiais.

Hoje tentaremos saber quanto tempo dura a jornada de trabalho, se descansam e se têm férias. Ou talvez sejam robôs, afinal? Pelo menos algum. Nova história de detetive sobre Habré. Isso vai ser interessante. Vamos começar!

Procure por vítimas

Determinar qual usuário do Habr é o editor não é difícil. Eles são prolíficos e escrevem, escrevem, escrevem. Alguns deles escrevem postagens regulares, outros escrevem notícias e outros escrevem ambos. Hoje vamos nos concentrar em notícias. No momento da minha análise inicial, a última página de notícias disponível para visualização № 50 continha publicações a partir de 03.09.2019/3/04.09.2019. É dezembro, o que significa que não é difícil encontrar publicações para 04.12.2019 meses. Para garantir (na verdade não), tomei o período de 4/XNUMX/XNUMX a XNUMX/XNUMX/XNUMX, para que nenhum dos dias fosse incluído apenas parcialmente nos dados. Além disso, já se passou uma semana inteira desde o dia XNUMX de dezembro e algo me diz que ninguém vai realmente ler esta notícia. E, consequentemente, eles não irão editá-los/ocultá-los em rascunhos.

Portanto, temos 92 dias em que foram publicados 946 posts na seção Notícias. As estatísticas do autor são as seguintes:

Detetive Habra: o mistério dos editores de notícias

Arroz. 1. Estatísticas de publicações de notícias

220 publicações contabilizadas talvez_elf, 139 - Annie Bronson, 129 - Denis-19, 122 - marcas e tudo 86 - alizar. Total - 696 notícias de 5 autores. Nenhum deles está se escondendo e está claramente escrito no perfil de todos que trabalham para Habré. Outros 6 autores escreveram mais de 10 publicações em 92 dias, e 19 escreveram mais de uma. Uma postagem de notícias foi publicada por 52 contas.

Lista de quem publicou mais de 10 notícias em 92 dias

Travis_Macrif
Leonid_R
baragol
k_karina
mary_arti
ITSumma
shurup

Como estamos interessados ​​em saber quando os editores trabalham e quando descansam, os melhores candidatos são aqueles que mais publicaram – os três primeiros. Afinal, espero que eles não estejam descansando e que o trabalho 24 horas por dia traia qualquer um.

Suponhamos que seja injusto comparar aqueles que trabalham como editores há vários meses com aqueles que trabalham no Habré há anos. Ou apenas leia todos os 7.3 mil posts marcas e 8.8 mil postagens alizar Eu realmente não quero. Então, talvez_elf, Annie Bronson и Denis-19.

Coleta de dados

Como eu não queria ler todas as publicações manualmente, usei métodos automatizados. Por um lado, isso privou a coleta de dados daquele calor e leveza que está tão perto de mim e sempre captura minha consciência. Por outro lado, algo me diz que enquanto eu reler ou pelo menos folhear tudo o que escrevi, o número de publicações para ler poderá duplicar.

Então. Uma lista de publicações de cada autor, disponível em habr(.)com/en/users/username/posts/ da página 1 à página 20 é registrada. O próximo passo é baixar cada publicação, e as informações necessárias são escritas em uma tabela geral de publicações do autor.

Informações adquiridas

  • ID da publicação;
  • data e hora;
  • título;
  • classificação (total de votos, prós, contras, classificação final);
  • número de marcadores;
  • número de visualizações;
  • número de comentários.

Apenas parte das informações será utilizada nesta história, mas não seria muito racional fazer upload de postagens e não coletar tudo o que puder.

Vale ressaltar que a partir desta seção são considerados todos os tipos de publicações, não apenas notícias. Isto é necessário para completar as estatísticas.

E depois de olhar atentamente para o monitor, você pode descobrir muita coisa...

Descobertas

Lugar 1

Vamos começar com o editor Habr mais ativo dos últimos 3 meses. Ao se registrar em 26.09.2019 de setembro de XNUMX, talvez_elf Comecei imediatamente a escrever, mas nunca escrevi um único comentário. A produtividade máxima de 6 publicações por dia foi alcançada 7 vezes e não houve publicações durante 15 dias. Vamos entrar em mais detalhes agora.

Detetive Habra: o mistério dos editores de notícias

Arroz. 2. Estatísticas de publicação talvez_elf

Você pode perceber que os editores têm dias de folga. Embora, aparentemente, não todas as semanas. A lista de finais de semana pode ser encontrada no spoiler. você talvez_elf houve férias de 8 dias no início de novembro, além de 3 sábados livres e 4 domingos em 80 dias. Por que férias e não licença médica, você pergunta. A licença médica dificilmente terminaria no sábado e no domingo iria direto para o trabalho.

Lista de feriados

05.10.2019/XNUMX/XNUMX (sáb);
06.10.2019/XNUMX/XNUMX (domingo);
12.10.2019/XNUMX/XNUMX (sáb);
13.10.2019/XNUMX/XNUMX (domingo);
20.10.2019/XNUMX/XNUMX (domingo);
02.11.2019 - 09.11.2019 (sábado - sábado);
01.12.2019/XNUMX/XNUMX (domingo);
07.12.2019/XNUMX/XNUMX (sábado).

E quanto ao horário de trabalho? As postagens são publicadas a partir das 07h02 UTC (10h02 horário de Moscou, onde fica o escritório da TM e Habr, se não me engano) e até 21h59 UTC (00h59). O pico de produtividade é das 10h às 00h10, e há algumas postagens antes das 59h e depois das 8h.

Número de artigos por horário de publicação (UTC)

5 (07h00 - 07h59);
25 (08h00 - 08h59);
27 (09h00 - 09h59);
33 (10h00 - 10h59);
26 (11h00 - 11h59);
20 (12h00 - 12h59);
17 (13h00 - 13h59);
24 (14h00 - 14h59);
21 (15h00 - 15h59);
15 (16h00 - 16h59);
13 (17h00 - 17h59);
10 (18h00 - 18h59);
7 (19h00 - 19h59);
5 (20h00 - 20h59);
2 (21:00 - 21:59).

Vale esclarecer que o horário de funcionamento provavelmente depende do dia da semana, por isso são poucos os detalhes. Por exemplo, na sexta-feira não há postagens depois das 17h43 - é por isso que é sexta-feira. Mas as últimas postagens são na quarta e quinta-feira. Detalhes sob o spoiler.

Horário da atividade (UTC) dependendo do dia da semana

08h39 – 18h25 (Seg);
07h10 – 19h54 (terça);
07h41 - 21h01 (Quarta);
07h02 - 21h59 (qui);
08h33 – 17h43 (sexta);
07h24 - 17h43 (sábado);
08h36 - 18h27 (dom).

Já que descobrimos que pelo menos um dos editores definitivamente tem fins de semana (e até férias?), passemos à questão mais importante. Muitas vezes intriga os leitores do Habr e é periodicamente discutido nos comentários das postagens que menos gostaram. Quantidade ou qualidade? Os editores têm padrões para publicações?

Minha resposta é sim. Por que? Basta olhar para o número de publicações por semana. Com invejável regularidade, esse número caiu abaixo de 20 apenas no período de descanso, bem como na primeira semana de trabalho, que foi de 4 dias em vez de 7. A média de publicações por semana é de 23.7, e os detalhes semanais estão esperando por você sob o spoiler.

Número de publicações por semana

22 (09.12.2019 - 14.12.2019);
22 (02.12.2019 - 08.12.2019);
22 (25.11.2019 - 01.12.2019);
27 (18.11.2019 - 24.11.2019);
23 (11.11.2019 - 17.11.2019);
3 (04.11.2019 - 10.11.2019);
24 (28.10.2019 - 03.11.2019);
25 (21.10.2019 - 27.10.2019);
26 (14.10.2019 - 20.10.2019);
26 (07.10.2019 - 13.10.2019);
20 (30.09.2019 - 06.10.2019);
10 (26.09.2019 - 29.09.2019).

Lugar 2

Em segundo lugar com 139 postagens em 92 dias está a editora Anya Annie Bronson (nome das informações do usuário). Quando a escrita de Habr começou, em 20.06.2019 de junho de 255, ela já tinha 5 postagens em sua conta. O máximo por dia é de 7 peças (atingido 66 vezes), e o dia mais produtivo é quarta-feira. 178 dias de XNUMX ficaram sem publicações.

Detetive Habra: o mistério dos editores de notícias

Arroz. 3. Estatísticas de publicação Annie Bronson

O número de postagens por semana varia de 3 (apenas uma vez) a 17 (3 semanas), e o número médio de postagens é de 9.8 por semana.

Número de publicações por semana

12 (09.12.2019 - 14.12.2019);
4 (02.12.2019 - 08.12.2019);
14 (25.11.2019 - 01.12.2019);
14 (18.11.2019 - 24.11.2019);
6 (11.11.2019 - 17.11.2019);
10 (04.11.2019 - 10.11.2019);
15 (28.10.2019 - 03.11.2019);
8 (21.10.2019 - 27.10.2019);
7 (14.10.2019 - 20.10.2019);
13 (07.10.2019 - 13.10.2019);
17 (30.09.2019 - 06.10.2019);
8 (23.09.2019 - 29.09.2019);
7 (16.09.2019 - 22.09.2019);
13 (09.09.2019 - 15.09.2019);
12 (02.09.2019 - 08.09.2019);
4 (26.08.2019 - 01.09.2019);
8 (19.08.2019 - 25.08.2019);
17 (12.08.2019 - 18.08.2019);
17 (05.08.2019 - 11.08.2019);
5 (29.07.2019 - 04.08.2019);
6 (22.07.2019 - 28.07.2019);
3 (15.07.2019 - 21.07.2019);
8 (08.07.2019 - 14.07.2019);
4 (01.07.2019 - 07.07.2019);
13 (24.06.2019 - 30.06.2019);
10 (20.06.2019 - 23.06.2019).

Há um ponto interessante sobre o horário de trabalho. As postagens começam às 3h UTC e terminam às 00h22. Parece que alguém está exagerando um pouco, mas isso não é certo.

Número de artigos por horário de publicação (UTC)

8 (03:00 - 06:59)
7 (07h00 - 07h59);
15 (08h00 - 08h59);
10 (09h00 - 09h59);
24 (10h00 - 10h59);
30 (11h00 - 11h59);
29 (12h00 - 12h59);
30 (13h00 - 13h59);
23 (14h00 - 14h59);
19 (15h00 - 15h59);
20 (16h00 - 16h59);
14 (17h00 - 17h59);
8 (18h00 - 18h59);
9 (19h00 - 19h59);
6 (20h00 - 20h59);
2 (21h00 - 21h59);
1 (22:00 - 22:59).

Qual dia da semana é o mais longo? A resposta é sexta-feira. Na verdade, não esqueça que estou ignorando a data e olhando apenas o dia da semana. É provável que o horário de trabalho tenha mudado muito. E no dia 27.09.2019 de setembro de 03 às 00hXNUMX algo interessante estava claramente acontecendo.

Horário da atividade (UTC) dependendo do dia da semana

07h16 – 19h26 (Seg);
07h29 – 19h37 (terça);
05h11 - 20h17 (Quarta);
06h00 - 22h33 (qui);
03h00 – 20h12 (sexta);
05h20 - 20h31 (sábado);
05h00 - 20h11 (dom).

Outro fato interessante é que este editor quase nunca escreve comentários. 5 comentários em 178 dias em Habré.

Lugar 3

3º lugar final para hoje com 129 postagens em 92 dias - Denis-19. No total, possui 359 publicações, algumas das quais datam de 2018. Quando esse usuário se tornou editor ou já o é desde o início? O número de publicações aumentou acentuadamente desde 01.08.2019/242/1.8. Desde então, foram escritas XNUMX postagens, uma média de XNUMX por dia. Vamos supor que esta foi a data de entrada em vigor dos poderes. Então, estatísticas.

Detetive Habra: o mistério dos editores de notícias

Arroz. 4. Estatísticas de publicação Denis-19

O dia mais produtivo é quinta-feira e um número bastante significativo de publicações no fim de semana. E quanto ao horário de trabalho? A primeira publicação é às 02:27 UTC, a última é às 23:25.

Um fato que poderia passar despercebido, mas não. 155 de 242 publicações (64.5%) são publicadas em tempos divisíveis por 5 minutos (:00, :05, :10, etc.). Por exemplo, todas as publicações a partir das 18h são exatamente assim. Isso acontece muitas vezes ao dia. Ou alguém é muito preciso (e tem muito tempo livre), ou os artigos são preparados normalmente e a automação os leva do rascunho à publicação.

No caso de uma postagem humana, o tempo gasto para corresponder a este modelo é em média de 2.5 minutos por artigo, o que equivale a cerca de 387.5 minutos por 155 postagens.

Para os outros dois editores, essa precisão ocorre em 54 dos 250 posts (21.6%, talvez_elf) e 54 de 255 (21.2%, Annie Bronson), que corresponde às estatísticas. O sistema numérico decimal tem 20% de chance ideal de encontrar um número que termine em 0 ou 5.

Neste sentido, penso que não é suficientemente interessante estudar o calendário das publicações. Se não forem cometidos por uma pessoa, não fornecerá nenhuma informação, mas se a pessoa o fizer, ela terá superpoderes e nada será descoberto.

Lista das publicações mais notáveis ​​24 horas por dia, 7 dias por semana

18h00 - 4 peças;
17h50 - 4 peças;
17h30 - 4 peças;
16h00 - 6 peças;
15h10 - 4 peças;
08h40 - 4 peças;
08h20 - 4 peças;
08h00 - 4 peças;
06h40 - 4 peças;
06h00 - 4 peças;
05h50 - 4 peças;
и т.д.

O horário de atividade durante o dia também não revela a pessoa real.

Horário da atividade (UTC) dependendo do dia da semana

03h51 – 23h25 (Seg);
04h00 – 18h30 (terça);
04h18 - 18h20 (Quarta);
02h48 - 23h00 (qui);
04h30 – 17h50 (sexta);
02h27 - 18h50 (sábado);
04h10 - 16h00 (dom).

Outra coisa que o distingue dos outros dois editores é que às vezes ele escreve comentários. 360 peças publicadas.

Em vez de uma conclusão

Assim, descobrimos aproximadamente quanto tempo trabalham os editores do Habr (três deles são os redatores de notícias mais ativos ultimamente), que eles têm dias de folga e que alguns deles são realmente pessoas e saem de férias.

E nos deparamos com outro mistério. Ou pelo menos algo suspeito. Parece que um dos três listados funciona em modo automático, pelo menos às vezes.

Talvez este não seja o caso. Mas temos um detetive. Nada pode acontecer...

Vamos pensar um pouco mais sobre isso...

Isso é tudo por hoje. Obrigado pela sua atenção!

PS Se você encontrar algum erro de digitação ou erro no texto, por favor me avise. Isso pode ser feito selecionando uma parte do texto e clicando em "Ctrl / ⌘ + Enter"se você tiver Ctrl / ⌘, via Mensagens privadas. Se ambas as opções não estiverem disponíveis, escreva sobre os erros nos comentários. Obrigado!

PPS Você também pode estar interessado em meus outros estudos sobre Habr.

Outras publicações

2019.11.24/XNUMX/XNUMX – Detetive Habra no fim de semana
2019.12.04/XNUMX/XNUMX — Detetive Habra e clima festivo
2019.12.08/XNUMX/XNUMX — Análise Habr: o que os usuários encomendam como presente da Habr

Fonte: habr.com

Adicionar um comentário