Une histoire sur la façon dont nos sites Web ont ralenti à cause d'une option sur le serveur Windows

Une histoire sur la façon dont nos sites Web ont ralenti à cause d'une option sur le serveur Windows

Beaucoup ont déjà entendu dire que Cloud4Y est un fournisseur de cloud d'entreprise. Par conséquent, nous ne parlerons pas de nous-mêmes, mais partagerons une courte histoire sur la façon dont nous avons rencontré des problèmes pour accéder à certains sites et ce qui en est la cause.

Un beau jour, le service marketing s'est plaint aux ingénieurs que lors de l'utilisation du terminal dans les navigateurs, certains sites mettaient beaucoup de temps à se charger. En particulier, vk.com est vital pour eux. Nous avons reçu le signal et avons commencé à comprendre quel était le problème.

Donc, la situation : fournisseur Internet Megafon, système d'exploitation du serveur Windows, navigateur Firefox. Si vous ouvrez VKontakte avec Windows 10 standard, le site se chargera en 10 à 100 ms. Si nous essayons d'ouvrir avec Windows Server 2012/16/19, le délai peut aller jusqu'à 15 secondes, voire plus.

Ont pris pixel VK, et grâce à lui, ils ont commencé à élaborer des versions possibles de ce qui se passait.

Hypothèse de test n°1 - un problème avec le serveur de terminaux.
Pas confirmé. Lors du test d'ouverture de la page via un autre serveur sur le même réseau, le problème a persisté.

Hypothèse de test n°2 : le problème réside dans la passerelle.
Pas confirmé. Il a été noté que sur les ordinateurs portables locaux, tout s'ouvre facilement et rapidement. Mais en même temps, le problème persiste pour les terminaux (et les serveurs internes). Nous avons joué avec les paramètres ICMP sur les interfaces externes et internes - cela n'a pas aidé.

C'est étrange d'une certaine manière.

Depuis un ordinateur portable local, le site ne ralentit pas.
Depuis la machine de numérisation interne (terminal de numérisation) - ne ralentit pas.
Mais la commercialisation est lente. Désordre!

Allons plus loin.

Hypothèse de test n°3 – Problème DNS.
Pas confirmé. Nous avons lancé le pixel via le DNS public (8.8.8.8) - la même histoire. Le problème est clairement visible la première fois que vous extrayez ce pixel en mode navigation privée, par exemple.

On soupçonne que le problème dépend fortement du navigateur. Dans FF, le pixel se fige toujours, dans Chrome à la première connexion. Le marketing reste bloqué tout le temps sur tous les navigateurs.

Hypothèse de test n°4 – Quelque chose avec le modèle de système d’exploitation.
Pas confirmé. Nous avons déployé un Windows Server 2016 propre et exécuté le test à partir du réseau .0. Nous avons un problème. Nous sommes passés au réseau .200, le problème a persisté. Autrement dit, la porte du réseau est .0. rien à voir avec ça. Cependant, les ordinateurs portables de ce réseau n'ont pas ce problème. Autrement dit, la porte du réseau est de 200. rien à voir avec ça non plus.

Autrement dit, ce n’est pas une question de modèle de système d’exploitation. La machine virtuelle ralentit lors du chargement du pixel. Mais si vous installez un VPN (carte réseau séparée) dessus et envoyez du trafic via celui-ci, alors tout fonctionne très rapidement (comme il se doit). On voit qu'il y a deux options qui peuvent poser problème : une passerelle au bureau ou un opérateur Internet au bureau.

Mais Megafon peut-il spécifiquement couper l'accès au pixel VKontakte ? Non, c'est une sorte d'absurdité. Essayons de creuser encore un peu.

Hypothèse de test n°5 - VMware Tools est responsable de tout.
Pas confirmé. Aucun effet nocif n'est observé. Nous avons essayé de modifier les paramètres de la carte, mais cela n'a pas fonctionné non plus. TTL modifié – aucun effet. Eh bien, la différence entre Windows 10 et Windows Server n’est généralement pas claire. Mais il y a une différence. Comme l'histoire avec le gopher.

Une histoire sur la façon dont nos sites Web ont ralenti à cause d'une option sur le serveur Windows

Nous traitons du problème depuis un certain temps. Bien sûr, nous avons recherché des situations similaires sur Google, mais nous n’avons rien trouvé. Nous avons donc agi sans rien demander, en élaborant toutes les versions possibles. Nous avons effectué des tests à partir d'un ordinateur portable Windows 2016 pour nous assurer que la virtualisation, etc., n'était pas à l'origine du ralentissement lors du chargement du pixel. Nous avons modifié tous les paramètres possibles de la carte réseau et de la pile IP. Nous avons essayé un tas de choses. Mais le problème persistait et le marketing est intervenu et a exigé que tout soit réglé.

Après un certain temps, nous avons finalement trouvé où le chien était enterré. Tout était question d'options
interface netsh tcp setglobal ecncapability = désactivé

Cette option est désactivée par défaut sur les systèmes d'exploitation Windows de bureau et activée par défaut sur les systèmes d'exploitation de serveur. Dès qu'on le désactive sur la salle des serveurs, tout s'ouvre instantanément, comme sur le bureau. Nous avons pu confirmer ce problème auprès du fournisseur qui nous fournit Internet au bureau (Megafon), via l'Internet mobile de Megafon (si vous le partagez depuis votre téléphone et vous vous connectez via Windows Server), via Yota, nous l'avons essayé dans certaines régions de Moscou et ce problème était présent partout. Lorsque l'on travaillait sur d'autres opérateurs, l'accès au site était instantané.

C’est un véritable gribouillis, comme l’a dit une personnalité politique éminente. En principe, le problème est désormais résolu, mais nous sommes très intéressés : cela s'est-il produit uniquement ici ou s'agit-il d'une catastrophe à grande échelle affectant des entreprises d'autres villes ? Si ce cas n'est pas isolé, Megafon devrait alors penser à résoudre ce problème. Après tout, l’option ECN (ecncapability) est activée par défaut sur les serveurs, et il faut beaucoup de temps pour comprendre de quoi il s’agit.

Comment vérifier? Oui, tout comme nous. En utilisant le navigateur Firefox, nous essayons d'ouvrir n'importe quelle page sur vk.com et encore en utilisant ctrl+f5. S'il y a un problème, il y aura un retard constant, s'il n'y a pas de problème, le site s'ouvrira instantanément.

Que pouvez-vous lire d'autre sur le blog ? Cloud4Y

L'énergie solaire salée
Comment la banque a-t-elle fait faillite ?
La théorie du grand flocon de neige
Internet sur des ballons
Les pentesters à la pointe de la cybersécurité

Abonnez-vous à notre Telegram-channel, pour ne pas rater le prochain article ! Nous n'écrivons pas plus de deux fois par semaine et uniquement pour affaires.

Seuls les utilisateurs enregistrés peuvent participer à l'enquête. se connecters'il te plait.

Rencontrez-vous un retard de chargement via Windows Server ?

  • 4,8%Oui, le chargement est long2

  • 50,0%Non, tout vole21

  • 45,2%Le problème ne vient pas des paramètres, mais des marketeurs19

42 utilisateurs ont voté. 35 utilisateurs se sont abstenus.

Source: habr.com

Ajouter un commentaire