Uma história sobre como nossos sites ficaram lentos por causa de uma opção no servidor Windows

Uma história sobre como nossos sites ficaram lentos por causa de uma opção no servidor Windows

Muitos já ouviram falar que Cloud4Y é um provedor de nuvem empresarial. Portanto, não falaremos sobre nós mesmos, mas compartilharemos uma pequena história sobre como tivemos problemas para acessar alguns sites e o que causou isso.

Um belo dia, o departamento de marketing reclamou com os engenheiros que, ao trabalhar pelo terminal em navegadores, alguns sites demoravam para carregar. Em particular, vk.com é vital para eles. Recebemos o sinal e começamos a descobrir qual era o problema.

Então, a situação: provedor de Internet Megafon, sistema operacional de servidor Windows, navegador Firefox. Se você abrir o VKontakte com o Windows 10 normal, o site carregará em 10-100 ms. Se tentarmos abrir com Windows Server 2012/16/19, o atraso é de até 15 segundos, ou até mais.

Peguei pixels VK, e através dele começaram a elaborar possíveis versões do que estava acontecendo.

Hipótese de teste nº 1 - um problema com o servidor de terminal.
Não confirmado. Ao testar a abertura da página através de outro servidor na mesma rede, o problema persistiu.

Testando a hipótese nº 2 - o problema está no gateway.
Não confirmado. Observou-se que em laptops locais tudo abre com facilidade e rapidez. Mas, ao mesmo tempo, o problema persiste nos terminais (e servidores internos). Brincamos com as configurações do ICMP nas interfaces externa e interna - não ajudou.

É estranho de alguma forma.

Em um laptop local, o site não fica lento.
Da máquina de digitalização interna (terminal para digitalização) - não fica lento.
Mas o marketing é lento. Transtorno!

Vamos mais longe.

Hipótese de teste nº 3 - problema de DNS.
Não confirmado. Lançamos o pixel por meio de DNS público (8.8.8.8) – a mesma história. O problema é claramente visível na primeira vez que você puxa esse pixel no modo de navegação anônima, por exemplo.

Suspeita-se que o problema dependa muito do navegador. No FF o pixel sempre congela, no chrome no primeiro login. O marketing fica preso o tempo todo em todos os navegadores.

Hipótese de teste nº 4 - Algo com o modelo do sistema operacional.
Não confirmado. Implantamos um Windows Server 2016 limpo e executamos o teste na rede .0. Nos temos um problema. Transferimos para a rede .200, o problema persistiu. Ou seja, a porta da rede é 0. nada a ver com isso. No entanto, os laptops desta rede não apresentam esse problema. Ou seja, a porta da rede é 200. nada a ver com isso também.

Ou seja, não se trata do modelo do sistema operacional. A máquina virtual fica mais lenta ao carregar o pixel. Mas se você instalar uma VPN (placa de rede separada) nele e enviar tráfego por meio dela, tudo funcionará muito rapidamente (como deveria ser). Vemos que existem duas opções que podem causar problemas: um gateway no escritório ou uma operadora de Internet no escritório.

Mas o Megafon pode cortar especificamente o acesso ao pixel VKontakte? Não, é algum tipo de bobagem. Vamos tentar cavar um pouco mais.

Hipótese de teste nº 5 - VMware Tools é o culpado por tudo.
Não confirmado. Nenhum efeito prejudicial é observado. Tentamos alterar as configurações do cartão, mas também não funcionou. TTL alterado - sem efeito. Bem, geralmente não está claro qual é a diferença entre o Windows 10 e o Windows Server. Mas há uma diferença. Como a história do esquilo.

Uma história sobre como nossos sites ficaram lentos por causa de uma opção no servidor Windows

Estamos lidando com o problema há algum tempo. Claro, pesquisamos situações semelhantes no Google, mas não encontramos nada. Então agimos sem avisar, elaborando todas as versões possíveis. Realizamos testes em um laptop Windows 2016 para garantir que a virtualização e assim por diante não fossem os culpados pela lentidão ao carregar o pixel. Alteramos todas as configurações possíveis da placa de rede e da pilha de IP. Tentamos um monte de coisas. Mas o problema permaneceu e o marketing entrou em ação e exigiu que tudo fosse consertado.

Depois de algum tempo, finalmente descobrimos onde o cachorro estava enterrado. Era tudo uma questão de opções
interface netsh tcp setglobal ecncapability=desativado

Esta opção está desabilitada por padrão em sistemas operacionais Windows de desktop e habilitada por padrão em sistemas operacionais de servidor. Assim que desabilitamos na sala do servidor, tudo abre instantaneamente, assim como na área de trabalho. Conseguimos confirmar este problema junto do fornecedor que nos fornece Internet no escritório (Megafon), através da Internet móvel Megafon (se partilhar do seu telefone e ligar através do Windows Server), através do Yota, experimentámos em algumas áreas de Moscovo e este problema estava presente em todo o lado. Ao trabalhar em outras operadoras, o acesso ao site foi instantâneo.

Isto é um rabisco, como disse uma figura política proeminente. Em princípio o problema já está resolvido, mas estamos muito interessados: ocorreu só aqui ou é um desastre de grande escala que afeta empresas de outras cidades? Se este caso não for isolado, então a Megafon deveria pensar em resolver este problema. Afinal, a opção ECN (ecncapability) está habilitada nos servidores por padrão e leva muito tempo para descobrir do que se trata.

Como verificar? Sim, assim como nós. Usando o navegador Firefox, tentamos abrir qualquer página em vk.com e novamente usando ctrl+f5. Se houver algum problema, haverá um atraso constante, se não houver problema, o site abrirá instantaneamente.

O que mais você pode ler no blog? Nuvem4Y

Energia solar salgada
Como o banco faliu?
A teoria do grande floco de neve
Internet em balões
Pentesters na vanguarda da segurança cibernética

Assine o nosso Telegram-channel para não perder o próximo artigo! Escrevemos no máximo duas vezes por semana e apenas a negócios.

Apenas usuários registrados podem participar da pesquisa. Entrarpor favor

Você está enfrentando um atraso no carregamento do Windows Server?

  • 4,8%Sim, demora muito para carregar2

  • 50,0%Não, tudo voa21

  • 45,2%O problema não está nas configurações, mas nos profissionais de marketing19

42 usuários votaram. 35 usuários se abstiveram.

Fonte: habr.com

Adicionar um comentário