Mnohí už počuli, že Cloud4Y je poskytovateľ podnikového cloudu. Preto nebudeme hovoriť o sebe, ale podelíme sa o krátky príbeh o tom, ako sme mali problémy s prístupom na niektoré stránky a čo to spôsobilo.
Jedného pekného dňa sa marketingové oddelenie sťažovalo inžinierom, že pri práci cez terminál v prehliadačoch sa niektoré stránky načítavali dlho. Najmä vk.com je pre nich životne dôležitá. Dostali sme signál a začali sme zisťovať, v čom je problém.
Takže situácia: poskytovateľ internetu Megafon, operačný systém Windows server, prehliadač Firefox. Ak otvoríte VKontakte s bežným systémom Windows 10, stránka sa načíta za 10-100 ms. Ak sa pokúsime otvoriť so systémom Windows Server 2012/16/19, oneskorenie je až 15 sekúnd alebo aj viac.
Zobral
Testovanie hypotézy č. 1 - problém s terminálovým serverom.
Nepotvrdené. Pri testovaní otvárania stránky cez iný server v rovnakej sieti problém pretrvával.
Testovanie hypotézy č.2 - problém je v bráne.
Nepotvrdené. Zistilo sa, že na miestnych prenosných počítačoch sa všetko otvára ľahko a rýchlo. Zároveň však problém pretrváva pre terminály (a interné servery). Pohrali sme sa s nastavením ICMP na externom a internom rozhraní - nepomohlo.
Je to nejako zvláštne.
Z lokálneho notebooku sa stránka nespomalí.
Z interného skenovacieho stroja (terminál na skenovanie) - nespomaľuje sa.
Marketing je však pomalý. Porucha!
Poďme ďalej.
Testovanie hypotézy č. 3 - Problém DNS.
Nepotvrdené. Spustili sme pixel prostredníctvom verejného DNS (8.8.8.8) – rovnaký príbeh. Problém je jasne viditeľný napríklad pri prvom vytiahnutí tohto pixelu v režime inkognito.
Existuje podozrenie, že problém vo veľkej miere závisí od prehliadača. Vo FF pixel zamrzne vždy, v chrome pri prvom prihlásení. Marketing sa neustále zasekne vo všetkých prehliadačoch.
Testovanie hypotézy č. 4 – Niečo so šablónou OS.
Nepotvrdené. Nasadili sme čistý Windows Server 2016 a spustili sme test zo siete .0. Máme problém. Prešli sme na sieť .200, problém pretrvával. To znamená, že brána siete je 0. nič s tým. Notebooky z tejto siete však tento problém nemajú. To znamená, že brána siete je 200. tiež s tým nemá nič spoločné.
To znamená, že to nie je záležitosť šablóny operačného systému. Virtuálny stroj sa pri načítavaní pixelu spomalí. Ale ak si naň nainštalujete VPN (samostatnú sieťovú kartu) a budete cez ňu posielať prevádzku, tak všetko funguje veľmi rýchlo (ako má byť). Vidíme, že existujú dve možnosti, ktoré môžu spôsobiť problém: brána v kancelárii alebo internetový operátor v kancelárii.
Môže však Megafon konkrétne odrezať prístup k pixelu VKontakte? Nie, je to nejaký nezmysel. Skúsme ešte kopať.
Testovanie hypotézy č.5 - Za všetko môžu VMware Tools.
Nepotvrdené. Nie sú pozorované žiadne škodlivé účinky. Skúšali sme zmeniť nastavenia karty, ale ani to nefungovalo. TTL zmenené – žiadny efekt. Vo všeobecnosti nie je jasné, aký je rozdiel medzi Windowsom 10 a Windows Serverom. Ale je tu rozdiel. Ako príbeh s gopherom.
Problémom sa zaoberáme už pomerne dlho. Podobné situácie sme samozrejme googlili, ale nič nenašli. Takže sme konali bez vyzvania a vypracovali sme všetky možné verzie. Uskutočnili sme testovanie z notebooku so systémom Windows 2016, aby sme sa uistili, že za spomalenie pri načítavaní pixela nemôže virtualizácia atď. Zmenili sme všetky možné nastavenia sieťovej karty a zásobníka IP. Vyskúšali sme veľa vecí. Ale problém ostal a marketing naštartoval a požadoval, aby sa všetko napravilo.
Po nejakom čase sme konečne zistili, kde je pes zakopaný. Všetko to bolo o možnostiach
netsh interface tcp setglobal ecncapability=disabled
Táto možnosť je predvolene vypnutá v operačných systémoch Windows pre stolné počítače a predvolene povolená v operačných systémoch serverov. Akonáhle ho deaktivujeme v serverovej miestnosti, všetko sa otvorí okamžite, rovnako ako na pracovnej ploche. Tento problém sa nám podarilo potvrdiť od poskytovateľa, ktorý nám poskytuje internet v kancelárii (Megafon), cez mobilný internet od Megafonu (ak ho zdieľate z telefónu a pripájate sa cez Windows Server), cez Yotu, vyskúšali sme to v niektorých oblastiach Moskvy a tento problém bol prítomný všade. Pri práci na iných operátoroch bol prístup na stránku okamžitý.
To je taká šibačka, ako sa vyjadrila jedna významná politická osobnosť. V zásade je problém už vyriešený, ale nás veľmi zaujíma: došlo k nemu len tu alebo ide o rozsiahlu katastrofu, ktorá postihla spoločnosti z iných miest? Ak tento prípad nie je izolovaný, potom by mal Megafon premýšľať o vyriešení tohto problému. Koniec koncov, možnosť ECN (ecncapability) je predvolene povolená na serveroch a trvá veľa času, kým sa zistí, o čo ide.
Ako skontrolovať? Áno, rovnako ako my. Pomocou prehliadača Firefox sa pokúsime otvoriť ľubovoľnú stránku na vk.com a znova pomocou ctrl+f5. Ak sa vyskytne problém, bude neustále meškať, ak nie je problém, stránka sa otvorí okamžite.
Čo si ešte môžete prečítať na blogu?
→
→
→
→
→
Prihláste sa na odber
Do prieskumu sa môžu zapojiť iba registrovaní užívatelia.
Dochádza k oneskoreniu pri načítavaní cez Windows Server?
-
4,8%Áno, načítanie trvá dlho2
-
50,0%Nie, všetko letí21
-
45,2%Problém nie je v nastaveniach, ale v marketéroch19
Hlasovalo 42 užívateľov. 35 užívateľov sa zdržalo hlasovania.
Zdroj: hab.com