Príbeh o tom, ako sa naše webové stránky spomalili kvôli jednej možnosti na serveri Windows

Príbeh o tom, ako sa naše webové stránky spomalili kvôli jednej možnosti na serveri Windows

Mnohí už počuli, že Cloud4Y je poskytovateľ podnikového cloudu. Preto nebudeme hovoriť o sebe, ale podelíme sa o krátky príbeh o tom, ako sme mali problémy s prístupom na niektoré stránky a čo to spôsobilo.

Jedného pekného dňa sa marketingové oddelenie sťažovalo inžinierom, že pri práci cez terminál v prehliadačoch sa niektoré stránky načítavali dlho. Najmä vk.com je pre nich životne dôležitá. Dostali sme signál a začali sme zisťovať, v čom je problém.

Takže situácia: poskytovateľ internetu Megafon, operačný systém Windows server, prehliadač Firefox. Ak otvoríte VKontakte s bežným systémom Windows 10, stránka sa načíta za 10-100 ms. Ak sa pokúsime otvoriť so systémom Windows Server 2012/16/19, oneskorenie je až 15 sekúnd alebo aj viac.

Zobral pixel VKa cez neho začali vymýšľať možné verzie toho, čo sa dialo.

Testovanie hypotézy č. 1 - problém s terminálovým serverom.
Nepotvrdené. Pri testovaní otvárania stránky cez iný server v rovnakej sieti problém pretrvával.

Testovanie hypotézy č.2 - problém je v bráne.
Nepotvrdené. Zistilo sa, že na miestnych prenosných počítačoch sa všetko otvára ľahko a rýchlo. Zároveň však problém pretrváva pre terminály (a interné servery). Pohrali sme sa s nastavením ICMP na externom a internom rozhraní - nepomohlo.

Je to nejako zvláštne.

Z lokálneho notebooku sa stránka nespomalí.
Z interného skenovacieho stroja (terminál na skenovanie) - nespomaľuje sa.
Marketing je však pomalý. Porucha!

Poďme ďalej.

Testovanie hypotézy č. 3 - Problém DNS.
Nepotvrdené. Spustili sme pixel prostredníctvom verejného DNS (8.8.8.8) – rovnaký príbeh. Problém je jasne viditeľný napríklad pri prvom vytiahnutí tohto pixelu v režime inkognito.

Existuje podozrenie, že problém vo veľkej miere závisí od prehliadača. Vo FF pixel zamrzne vždy, v chrome pri prvom prihlásení. Marketing sa neustále zasekne vo všetkých prehliadačoch.

Testovanie hypotézy č. 4 – Niečo so šablónou OS.
Nepotvrdené. Nasadili sme čistý Windows Server 2016 a spustili sme test zo siete .0. Máme problém. Prešli sme na sieť .200, problém pretrvával. To znamená, že brána siete je 0. nič s tým. Notebooky z tejto siete však tento problém nemajú. To znamená, že brána siete je 200. tiež s tým nemá nič spoločné.

To znamená, že to nie je záležitosť šablóny operačného systému. Virtuálny stroj sa pri načítavaní pixelu spomalí. Ale ak si naň nainštalujete VPN (samostatnú sieťovú kartu) a budete cez ňu posielať prevádzku, tak všetko funguje veľmi rýchlo (ako má byť). Vidíme, že existujú dve možnosti, ktoré môžu spôsobiť problém: brána v kancelárii alebo internetový operátor v kancelárii.

Môže však Megafon konkrétne odrezať prístup k pixelu VKontakte? Nie, je to nejaký nezmysel. Skúsme ešte kopať.

Testovanie hypotézy č.5 - Za všetko môžu VMware Tools.
Nepotvrdené. Nie sú pozorované žiadne škodlivé účinky. Skúšali sme zmeniť nastavenia karty, ale ani to nefungovalo. TTL zmenené – žiadny efekt. Vo všeobecnosti nie je jasné, aký je rozdiel medzi Windowsom 10 a Windows Serverom. Ale je tu rozdiel. Ako príbeh s gopherom.

Príbeh o tom, ako sa naše webové stránky spomalili kvôli jednej možnosti na serveri Windows

Problémom sa zaoberáme už pomerne dlho. Podobné situácie sme samozrejme googlili, ale nič nenašli. Takže sme konali bez vyzvania a vypracovali sme všetky možné verzie. Uskutočnili sme testovanie z notebooku so systémom Windows 2016, aby sme sa uistili, že za spomalenie pri načítavaní pixela nemôže virtualizácia atď. Zmenili sme všetky možné nastavenia sieťovej karty a zásobníka IP. Vyskúšali sme veľa vecí. Ale problém ostal a marketing naštartoval a požadoval, aby sa všetko napravilo.

Po nejakom čase sme konečne zistili, kde je pes zakopaný. Všetko to bolo o možnostiach
netsh interface tcp setglobal ecncapability=disabled

Táto možnosť je predvolene vypnutá v operačných systémoch Windows pre stolné počítače a predvolene povolená v operačných systémoch serverov. Akonáhle ho deaktivujeme v serverovej miestnosti, všetko sa otvorí okamžite, rovnako ako na pracovnej ploche. Tento problém sa nám podarilo potvrdiť od poskytovateľa, ktorý nám poskytuje internet v kancelárii (Megafon), cez mobilný internet od Megafonu (ak ho zdieľate z telefónu a pripájate sa cez Windows Server), cez Yotu, vyskúšali sme to v niektorých oblastiach Moskvy a tento problém bol prítomný všade. Pri práci na iných operátoroch bol prístup na stránku okamžitý.

To je taká šibačka, ako sa vyjadrila jedna významná politická osobnosť. V zásade je problém už vyriešený, ale nás veľmi zaujíma: došlo k nemu len tu alebo ide o rozsiahlu katastrofu, ktorá postihla spoločnosti z iných miest? Ak tento prípad nie je izolovaný, potom by mal Megafon premýšľať o vyriešení tohto problému. Koniec koncov, možnosť ECN (ecncapability) je predvolene povolená na serveroch a trvá veľa času, kým sa zistí, o čo ide.

Ako skontrolovať? Áno, rovnako ako my. Pomocou prehliadača Firefox sa pokúsime otvoriť ľubovoľnú stránku na vk.com a znova pomocou ctrl+f5. Ak sa vyskytne problém, bude neustále meškať, ak nie je problém, stránka sa otvorí okamžite.

Čo si ešte môžete prečítať na blogu? Cloud4Y

Slaná slnečná energia
Ako zlyhala banka?
Teória veľkej snehovej vločky
Internet na balónoch
Pentesters v popredí kybernetickej bezpečnosti

Prihláste sa na odber telegram-kanál, aby ste nezmeškali ďalší článok! Píšeme si maximálne dvakrát do týždňa a len služobne.

Do prieskumu sa môžu zapojiť iba registrovaní užívatelia. Prihlásiť saProsím.

Dochádza k oneskoreniu pri načítavaní cez Windows Server?

  • 4,8%Áno, načítanie trvá dlho2

  • 50,0%Nie, všetko letí21

  • 45,2%Problém nie je v nastaveniach, ale v marketéroch19

Hlasovalo 42 užívateľov. 35 užívateľov sa zdržalo hlasovania.

Zdroj: hab.com

Pridať komentár