Wiele osób już słyszało, że Cloud4Y jest dostawcą chmury dla przedsiębiorstw. Dlatego nie będziemy rozmawiać o sobie, ale podzielimy się krótką historią o tym, jak mieliśmy problemy z dostępem do niektórych stron i co było tego przyczyną.
Pewnego pięknego dnia dział marketingu poskarżył się inżynierom, że podczas pracy przez terminal w przeglądarkach niektóre strony ładowały się długo. W szczególności vk.com jest dla nich niezbędny. Otrzymaliśmy sygnał i zaczęliśmy zastanawiać się, na czym polega problem.
A więc sytuacja: dostawca Internetu Megafon, system operacyjny serwera Windows, przeglądarka Firefox. Jeśli otworzysz VKontakte w zwykłym systemie Windows 10, strona załaduje się w ciągu 10-100 ms. Jeśli spróbujemy otworzyć w systemie Windows Server 2012/16/19, opóźnienie wynosi do 15 sekund lub nawet więcej.
Wziął
Testowanie hipotezy nr 1 - problem z serwerem terminali.
Nie potwierdzone. Podczas testowania otwierania strony za pośrednictwem innego serwera w tej samej sieci, problem nadal występował.
Testowanie hipotezy nr 2 – problem tkwi w bramce.
Nie potwierdzone. Zauważono, że na lokalnych laptopach wszystko otwiera się łatwo i szybko. Ale jednocześnie problem występuje w przypadku terminali (i serwerów wewnętrznych). Bawiliśmy się ustawieniami ICMP na interfejsie zewnętrznym i wewnętrznym - nie pomogło.
To w jakiś sposób dziwne.
Z lokalnego laptopa strona nie zwalnia.
Z wewnętrznego skanera (terminal do skanowania) - nie zwalnia.
Ale marketing jest powolny. Nieład!
Idźmy dalej.
Testowanie hipotezy nr 3 – problem z DNS.
Nie potwierdzone. Uruchomiliśmy piksel przez publiczny DNS (8.8.8.8) - ta sama historia. Problem jest wyraźnie widoczny przy pierwszym pociągnięciu tego piksela np. w trybie incognito.
Istnieje podejrzenie, że problem zależy w dużej mierze od przeglądarki. W FF piksel zawsze się zawiesza, w chrome przy pierwszym logowaniu. Marketing cały czas blokuje się we wszystkich przeglądarkach.
Testowanie hipotezy nr 4 – Coś z szablonem systemu operacyjnego.
Nie potwierdzone. Wdrożyliśmy czysty system Windows Server 2016 i przeprowadziliśmy test z sieci .0. Mamy problem. Przenieśliśmy się do sieci .200, problem nadal występował. Oznacza to, że brama sieciowa wynosi 0. nie ma z tym nic wspólnego. Jednak laptopy z tej sieci nie mają tego problemu. Oznacza to, że bramka sieciowa ma wartość 200. też nie ma z tym nic wspólnego.
Oznacza to, że nie jest to kwestia szablonu systemu operacyjnego. Maszyna wirtualna zwalnia podczas ładowania piksela. Ale jeśli zainstalujesz na nim VPN (oddzielną kartę sieciową) i prześlesz przez nią ruch, wszystko będzie działać bardzo szybko (tak jak powinno). Widzimy, że są dwie opcje, które mogą powodować problem: bramka w biurze lub operator Internetu w biurze.
Ale czy Megafon może specjalnie odciąć dostęp do piksela VKontakte? Nie, to jakiś nonsens. Spróbujmy pogrzebać jeszcze trochę.
Testowanie hipotezy nr 5 – Wszystkiemu winne są narzędzia VMware Tools.
Nie potwierdzone. Nie obserwuje się żadnych szkodliwych skutków. Próbowaliśmy zmienić ustawienia karty, ale to też nie zadziałało. TTL zmienione - bez efektu. Cóż, ogólnie nie jest jasne, jaka jest różnica między systemem Windows 10 a systemem Windows Server. Ale jest różnica. Podobnie jak historia z susłem.
Z problemem borykamy się już dłuższy czas. Oczywiście szukaliśmy w Google podobnych sytuacji, ale nic nie znaleźliśmy. Działaliśmy więc bez podpowiedzi, opracowując wszystkie możliwe wersje. Przeprowadziliśmy testy na laptopie z systemem Windows 2016, aby upewnić się, że wirtualizacja i tym podobne nie są winne spowolnienia podczas ładowania piksela. Zmieniliśmy wszystkie możliwe ustawienia karty sieciowej i stosu IP. Próbowaliśmy wielu rzeczy. Ale problem pozostał, a marketing włączył się i zażądał, aby wszystko zostało naprawione.
Po pewnym czasie w końcu udało się ustalić miejsce pochowania psa. Wszystko zależało od opcji
interfejs netsh tcp setglobal ecncapability = wyłączony
Ta opcja jest domyślnie wyłączona w stacjonarnych systemach operacyjnych Windows i domyślnie włączona w serwerowych systemach operacyjnych. Gdy tylko wyłączymy to w serwerowni, wszystko otwiera się natychmiast, tak samo jak na pulpicie. Udało nam się potwierdzić ten problem od dostawcy, który zapewnia nam Internet w biurze (Megafon), poprzez mobilny Internet Megafon (jeśli udostępnisz go z telefonu i połączysz się przez Windows Server), poprzez Yota, wypróbowaliśmy to w niektórych obszarach Moskwy i problem ten występował wszędzie. Podczas pracy na innych operatorach dostęp do strony był błyskawiczny.
To taki zakręt, jak to ujął jeden z prominentnych działaczy politycznych. W zasadzie problem został już rozwiązany, ale nas bardzo ciekawi: czy pojawił się tylko tutaj, czy jest to katastrofa na dużą skalę, która dotknęła firmy z innych miast? Jeśli ten przypadek nie jest odosobniony, to Megafon powinien pomyśleć o rozwiązaniu tego problemu. W końcu opcja ECN (ecncapability) jest domyślnie włączona na serwerach i zrozumienie, o co w tym wszystkim chodzi, zajmuje dużo czasu.
Jak sprawdzić? Tak, zupełnie jak my. Za pomocą przeglądarki Firefox próbujemy otworzyć dowolną stronę na vk.com i ponownie za pomocą ctrl+f5. Jeśli wystąpi problem, będzie ciągłe opóźnienie, jeśli nie będzie problemu, strona otworzy się natychmiast.
Co jeszcze można przeczytać na blogu?
→
→
→
→
→
Zapisz się do naszego
W ankiecie mogą brać udział tylko zarejestrowani użytkownicy.
Czy występują opóźnienia w ładowaniu systemu Windows Server?
-
4,8%Tak, ładowanie zajmuje dużo czasu2
-
50,0%Nie, wszystko leci21
-
45,2%Problem nie leży w ustawieniach, ale w marketerach19
Głosowało 42 użytkowników. 35 użytkowników wstrzymało się od głosu.
Źródło: www.habr.com