Historia o tym, jak nasze strony spowolniły z powodu jednej opcji na serwerze Windows

Historia o tym, jak nasze strony spowolniły z powodu jednej opcji na serwerze Windows

Wiele osób już słyszało, że Cloud4Y jest dostawcą chmury dla przedsiębiorstw. Dlatego nie będziemy rozmawiać o sobie, ale podzielimy się krótką historią o tym, jak mieliśmy problemy z dostępem do niektórych stron i co było tego przyczyną.

Pewnego pięknego dnia dział marketingu poskarżył się inżynierom, że podczas pracy przez terminal w przeglądarkach niektóre strony ładowały się długo. W szczególności vk.com jest dla nich niezbędny. Otrzymaliśmy sygnał i zaczęliśmy zastanawiać się, na czym polega problem.

A więc sytuacja: dostawca Internetu Megafon, system operacyjny serwera Windows, przeglądarka Firefox. Jeśli otworzysz VKontakte w zwykłym systemie Windows 10, strona załaduje się w ciągu 10-100 ms. Jeśli spróbujemy otworzyć w systemie Windows Server 2012/16/19, opóźnienie wynosi do 15 sekund lub nawet więcej.

Wziął piksel VKi za jego pośrednictwem zaczęli opracowywać możliwe wersje tego, co się działo.

Testowanie hipotezy nr 1 - problem z serwerem terminali.
Nie potwierdzone. Podczas testowania otwierania strony za pośrednictwem innego serwera w tej samej sieci, problem nadal występował.

Testowanie hipotezy nr 2 – problem tkwi w bramce.
Nie potwierdzone. Zauważono, że na lokalnych laptopach wszystko otwiera się łatwo i szybko. Ale jednocześnie problem występuje w przypadku terminali (i serwerów wewnętrznych). Bawiliśmy się ustawieniami ICMP na interfejsie zewnętrznym i wewnętrznym - nie pomogło.

To w jakiś sposób dziwne.

Z lokalnego laptopa strona nie zwalnia.
Z wewnętrznego skanera (terminal do skanowania) - nie zwalnia.
Ale marketing jest powolny. Nieład!

Idźmy dalej.

Testowanie hipotezy nr 3 – problem z DNS.
Nie potwierdzone. Uruchomiliśmy piksel przez publiczny DNS (8.8.8.8) - ta sama historia. Problem jest wyraźnie widoczny przy pierwszym pociągnięciu tego piksela np. w trybie incognito.

Istnieje podejrzenie, że problem zależy w dużej mierze od przeglądarki. W FF piksel zawsze się zawiesza, w chrome przy pierwszym logowaniu. Marketing cały czas blokuje się we wszystkich przeglądarkach.

Testowanie hipotezy nr 4 – Coś z szablonem systemu operacyjnego.
Nie potwierdzone. Wdrożyliśmy czysty system Windows Server 2016 i przeprowadziliśmy test z sieci .0. Mamy problem. Przenieśliśmy się do sieci .200, problem nadal występował. Oznacza to, że brama sieciowa wynosi 0. nie ma z tym nic wspólnego. Jednak laptopy z tej sieci nie mają tego problemu. Oznacza to, że bramka sieciowa ma wartość 200. też nie ma z tym nic wspólnego.

Oznacza to, że nie jest to kwestia szablonu systemu operacyjnego. Maszyna wirtualna zwalnia podczas ładowania piksela. Ale jeśli zainstalujesz na nim VPN (oddzielną kartę sieciową) i prześlesz przez nią ruch, wszystko będzie działać bardzo szybko (tak jak powinno). Widzimy, że są dwie opcje, które mogą powodować problem: bramka w biurze lub operator Internetu w biurze.

Ale czy Megafon może specjalnie odciąć dostęp do piksela VKontakte? Nie, to jakiś nonsens. Spróbujmy pogrzebać jeszcze trochę.

Testowanie hipotezy nr 5 – Wszystkiemu winne są narzędzia VMware Tools.
Nie potwierdzone. Nie obserwuje się żadnych szkodliwych skutków. Próbowaliśmy zmienić ustawienia karty, ale to też nie zadziałało. TTL zmienione - bez efektu. Cóż, ogólnie nie jest jasne, jaka jest różnica między systemem Windows 10 a systemem Windows Server. Ale jest różnica. Podobnie jak historia z susłem.

Historia o tym, jak nasze strony spowolniły z powodu jednej opcji na serwerze Windows

Z problemem borykamy się już dłuższy czas. Oczywiście szukaliśmy w Google podobnych sytuacji, ale nic nie znaleźliśmy. Działaliśmy więc bez podpowiedzi, opracowując wszystkie możliwe wersje. Przeprowadziliśmy testy na laptopie z systemem Windows 2016, aby upewnić się, że wirtualizacja i tym podobne nie są winne spowolnienia podczas ładowania piksela. Zmieniliśmy wszystkie możliwe ustawienia karty sieciowej i stosu IP. Próbowaliśmy wielu rzeczy. Ale problem pozostał, a marketing włączył się i zażądał, aby wszystko zostało naprawione.

Po pewnym czasie w końcu udało się ustalić miejsce pochowania psa. Wszystko zależało od opcji
interfejs netsh tcp setglobal ecncapability = wyłączony

Ta opcja jest domyślnie wyłączona w stacjonarnych systemach operacyjnych Windows i domyślnie włączona w serwerowych systemach operacyjnych. Gdy tylko wyłączymy to w serwerowni, wszystko otwiera się natychmiast, tak samo jak na pulpicie. Udało nam się potwierdzić ten problem od dostawcy, który zapewnia nam Internet w biurze (Megafon), poprzez mobilny Internet Megafon (jeśli udostępnisz go z telefonu i połączysz się przez Windows Server), poprzez Yota, wypróbowaliśmy to w niektórych obszarach Moskwy i problem ten występował wszędzie. Podczas pracy na innych operatorach dostęp do strony był błyskawiczny.

To taki zakręt, jak to ujął jeden z prominentnych działaczy politycznych. W zasadzie problem został już rozwiązany, ale nas bardzo ciekawi: czy pojawił się tylko tutaj, czy jest to katastrofa na dużą skalę, która dotknęła firmy z innych miast? Jeśli ten przypadek nie jest odosobniony, to Megafon powinien pomyśleć o rozwiązaniu tego problemu. W końcu opcja ECN (ecncapability) jest domyślnie włączona na serwerach i zrozumienie, o co w tym wszystkim chodzi, zajmuje dużo czasu.

Jak sprawdzić? Tak, zupełnie jak my. Za pomocą przeglądarki Firefox próbujemy otworzyć dowolną stronę na vk.com i ponownie za pomocą ctrl+f5. Jeśli wystąpi problem, będzie ciągłe opóźnienie, jeśli nie będzie problemu, strona otworzy się natychmiast.

Co jeszcze można przeczytać na blogu? Cloud4Y

Słona energia słoneczna
Jak upadł bank?
Teoria Wielkiego Płatka Śniegu
Internet na balonach
Pentesterzy na czele cyberbezpieczeństwa

Zapisz się do naszego Telegram-channel, żeby nie przegapić kolejnego artykułu! Piszemy nie częściej niż dwa razy w tygodniu i tylko w sprawach służbowych.

W ankiecie mogą brać udział tylko zarejestrowani użytkownicy. Zaloguj się, Proszę.

Czy występują opóźnienia w ładowaniu systemu Windows Server?

  • 4,8%Tak, ładowanie zajmuje dużo czasu2

  • 50,0%Nie, wszystko leci21

  • 45,2%Problem nie leży w ustawieniach, ale w marketerach19

Głosowało 42 użytkowników. 35 użytkowników wstrzymało się od głosu.

Źródło: www.habr.com

Dodaj komentarz