Mnozí již slyšeli, že Cloud4Y je poskytovatel podnikového cloudu. Proto nebudeme mluvit o sobě, ale podělíme se o krátký příběh o tom, jak jsme měli problémy s přístupem na některé stránky a co to způsobilo.
Jednoho krásného dne si marketingové oddělení stěžovalo inženýrům, že při práci přes terminál v prohlížečích se některé stránky načítají dlouho. Zejména vk.com je pro ně životně důležitý. Přijali jsme signál a začali zjišťovat, v čem je problém.
Takže situace: poskytovatel internetu Megafon, OS Windows server, prohlížeč Firefox. Pokud otevřete VKontakte s běžným Windows 10, stránka se načte za 10-100 ms. Pokud se pokusíme otevřít se systémem Windows Server 2012/16/19, zpoždění je až 15 sekund nebo i více.
Vzali
Testování hypotézy č. 1 - problém s terminálovým serverem.
Nepotvrzeno. Při testovacím otevření stránky prostřednictvím jiného serveru ve stejné síti problém přetrvával.
Testování hypotézy č. 2 - problém je v bráně.
Nepotvrzeno. Bylo poznamenáno, že na místních noteboocích se vše otevírá snadno a rychle. Ale zároveň problém přetrvává pro terminály (a interní servery). Pohráli jsme si s nastavením ICMP na vnějším i vnitřním rozhraní – nepomohlo.
Je to nějak zvláštní.
Z místního notebooku se web nezpomaluje.
Z interního Scan stroje (terminál pro skenování) - nezpomaluje.
Marketing je ale pomalý. Porucha!
Pojďme dále.
Testování hypotézy č. 3 - Problém DNS.
Nepotvrzeno. Spustili jsme pixel prostřednictvím veřejného DNS (8.8.8.8) – stejný příběh. Problém je jasně viditelný při prvním vytažení tohoto pixelu například v režimu inkognito.
Existuje podezření, že problém silně závisí na prohlížeči. Ve FF pixel zamrzne vždy, v chromu při prvním přihlášení. Marketing se neustále zasekává ve všech prohlížečích.
Testování hypotézy č. 4 – Něco se šablonou OS.
Nepotvrzeno. Nasadili jsme čistý Windows Server 2016 a spustili test ze sítě 0. Máme problém. Přešli jsme na síť .200, problém přetrvával. To znamená, že brána sítě je 0. s tím nemá nic společného. Notebooky z této sítě však tento problém nemají. To znamená, že brána sítě je 200. s tím taky nic společného.
To znamená, že to není záležitost šablony OS. Virtuální stroj se při načítání pixelu zpomalí. Pokud si na něj ale nainstalujete VPN (samostatnou síťovou kartu) a budete přes ni posílat provoz, tak vše funguje velmi rychle (jak má být). Vidíme, že existují dvě možnosti, které mohou způsobit problém: brána v kanceláři nebo internetový operátor v kanceláři.
Může však Megafon konkrétně odříznout přístup k pixelu VKontakte? Ne, je to nějaký nesmysl. Zkusme ještě kopat.
Testování hypotézy č. 5 - Za vše mohou VMware Tools.
Nepotvrzeno. Nejsou pozorovány žádné škodlivé účinky. Zkoušeli jsme změnit nastavení karty, ale ani to nefungovalo. TTL změněno - žádný účinek. Obecně není jasné, jaký je rozdíl mezi Windows 10 a Windows Server. Ale je tu rozdíl. Jako příběh s gopherem.
Problémem se zabýváme již delší dobu. Podobné situace jsme samozřejmě googlili, ale nic nenašli. Takže jsme jednali bez výzvy a vypracovali jsme všechny možné verze. Provedli jsme testování z notebooku s Windows 2016, abychom se ujistili, že virtualizace a tak dále nenesou vinu za zpomalení při načítání pixelu. Změnili jsme všechna možná nastavení síťové karty a IP stacku. Zkusili jsme spoustu věcí. Problém ale zůstal a marketing nastartoval a požadoval vše opravit.
Po nějaké době jsme konečně našli, kde je zakopaný pes. Všechno to bylo o možnostech
netsh interface tcp setglobal ecncapability=disabled
Tato možnost je ve výchozím nastavení zakázána na stolních operačních systémech Windows a ve výchozím nastavení povolena na serverových operačních systémech. Jakmile jej deaktivujeme na serverové místnosti, vše se okamžitě otevře, stejně jako na ploše. Tento problém jsme mohli potvrdit od poskytovatele, který nám poskytuje internet v kanceláři (Megafon), prostřednictvím mobilního internetu Megafon (pokud jej sdílíte z telefonu a připojujete se přes Windows Server), přes Yotu, vyzkoušeli jsme to v některých oblastech Moskvy a tento problém byl přítomen všude. Při práci na jiných operátorech byl přístup na stránky okamžitý.
To je taková klikatá, jak se vyjádřila jedna významná politická osobnost. V zásadě je problém nyní vyřešen, ale nás velmi zajímá: došlo k němu pouze zde, nebo se jedná o rozsáhlou katastrofu postihující společnosti z jiných měst? Pokud tento případ není ojedinělý, měl by Megafon přemýšlet o řešení tohoto problému. Koneckonců, možnost ECN (ecncapability) je na serverech ve výchozím nastavení povolena a trvá hodně času, než zjistíte, o co jde.
Jak zkontrolovat? Ano, stejně jako my. Pomocí prohlížeče Firefox se pokusíme otevřít jakoukoli stránku na vk.com a znovu pomocí ctrl+f5. Pokud se vyskytne problém, bude docházet k neustálému zpoždění, pokud není problém, stránka se otevře okamžitě.
Co dalšího si můžete přečíst na blogu?
→
→
→
→
→
Přihlaste se k odběru
Průzkumu se mohou zúčastnit pouze registrovaní uživatelé.
Dochází ke zpoždění při načítání prostřednictvím systému Windows Server?
-
4,8%Ano, načítání trvá dlouho2
-
50,0%Ne, všechno letí 21
-
45,2%Problém není v nastavení, ale v marketérech19
Hlasovalo 42 uživatelů. 35 uživatelů se zdrželo hlasování.
Zdroj: www.habr.com