Probleemi otsimine valest kohast

See on lühike lugu reaalsest praktikast, kui väike probleem, mis on hästi varjatud veataluvusega, muutub peavaluks.

Väike paigutus:

Väike haru, sellel on oma PBX (tärn + FreePBX), mis põhineb töölaua riistvaral, ja sama kohalik terminaliserver, millel on 1C, failitõmmis ja virtuaalne RO domeenikontroller. Internet levitab Mikrotikut. Oks on väike, neile piisab.
Kõik sai alguse monitooringust (ajapuuduse ja laiskuse tõttu kõike ei jälgita), mis teatas harus ühe serveri (keskjaamaga) ülekuumenemisest. Samal ajal kui kohalikud probleemi lahendasid, tardus vanamees ja rikkus kergelt MySQL-i andmebaasi.

Paljud asjad ennustasid probleeme, kuid mitte see...

Pole probleemi, alus on remonditud, kõik peaks toimima. Aga kohalikud kurdavad, kõned jäävad ära. Olgu - FreePBX-is on probleeme, teen varukoopia, juurutan selle, kõik on korras.
Aga probleem on käes, kohalikud ikka kurdavad, kõned ei lähe normaalselt läbi. Enne neid tundub kõne normaalselt läbi minevat, aga kui nad ise või üksteisele helistavad, siis tekib mitmesekundiline viivitus. Hakkan vaatama Asteriski ja FreePBX mahukaid ja arusaamatuid logisid, kuid ma ei suuda neis probleemi märgata. Mäletan, et STUNi ja ICE-ga oli probleem, mis andis sarnase viivituse. Lülitan kõik kuradima välja, tulemus on null.

Masetus on tee halbade otsuste langetamiseks:

Hakkan masendusse, tundidepikkune ATS-i kallal nokitsemine ei too kaasa midagi head, on juba hilja õhtu ja probleem ei lahene.
Jätsin probleemi hommikuks, lootes värsket pead. Hommikul sündis järjekordne ebaõnnestunud otsus: kuna süsteem oli katki (kuigi sõltuvus ei saanud olla nii hävitav), siis proovisin süsteemi parandada, installides kõik paketid uuesti. Tulemus veidi üle nulli, viivitus on vähenenud (mitte oluliselt, aga juba õnnestunud).
Teen veel ühe halva otsuse: kui OS-i (ja andmebaasi varukoopiast) osaline parandamine ei õnnestunud ja probleemi juur pole ikka veel selge ning põhjuse otsimisele on kulunud juba palju aega, siis otsustan tegutseda radikaalselt: lammutame OS-i ja veereme kõik nullist üle (õnneks teeb protsessi automatiseerimine seda vastuvõetava ajaga). Ajan FreePBX-i konfiguratsiooni koopiast välja. Järjekordne ebaõnnestumine. Tulemus on null!

Meeleheide – mõistus muutub häguseks, otsused muutuvad veelgi hullemaks

Ma langen meeleheitesse. Hakkavad väga halvad mõtted tulema, mõtlen: äkki on varukoopias konf viltu (mul juhtus peale mitmeid uuendusi, et peale neid ei töötanud ja põhjust ei õnnestunud leida), pole midagi alles : Pean kõik otsast peale kätega üle rullima. Milline häbi! Tulemus on rangelt null ja palju aega raisatud!

Aktsepteerimine on tee teadlikkuseni

Püüdes toimuvast meeleheitlikult aru saada, hakkan ma palke hoolikalt uurima. Märkan mustrit. Laienduse kõne toimub täpselt 5 sekundiga ja 3-st laiendist koosneva kõnegrupi puhul 15! Hakkan guugeldama kõne hilinemise kohta, aga juba viitan konkreetsele hilinemisele. Ja ma saan vastuse, mille olen juba leidnud, inimesed ütlevad, et probleem on DNS-is, kuid ma tean kindlalt, et probleemi pole, kõik aadressid on lahendatud!

Ilmselge – pole tõenäoline

Midagi pole teha, võtan nslookupi ja bingo (ma soovin, et saaksin seda kohe teha)! Esmane DNS on olemas (kontrolleriga virtuaalne masin), kuid ma isegi ei märganud! Kui oleks ainult üks DNS, oleks viga 😉

Summaarne

Elementaarne probleem, mida oleks võinud näha monitooringuga (mis peaks olema konfigureeritud kõigi sõlmede jaoks), maskeeritud DNS-i tõrketaluvusega, tõi kaasa pea kahe tööpäeva kaotuse rumala olukorra lahendamisel. Laiskus on piin, jälgimise seadistamine võtab minuti ja probleemi otsimine sealt, kus seda pole, võtab kaks päeva.

Küsitluses saavad osaleda ainult registreerunud kasutajad. Logi sissepalun.

Kas teiega on seda kunagi juhtunud?

  • Jah, väga harva

  • Jah, harva

  • Sageli

  • Väga tihti

  • Ei, kellegagi, lihtsalt mitte minuga!

  • Ei, ma olen eksimatu!

2 kasutajat hääletas. 1 kasutaja jäi erapooletuks.

Allikas: www.habr.com

Lisa kommentaar