Esta é unha pequena historia da práctica real, cando un pequeno problema, ben disfrazado pola tolerancia ás fallas, se converte nunha dor de cabeza.
Disposición pequena:
Unha pequena sucursal, ten a súa propia PBX (asterisco + FreePBX) baseada en hardware de escritorio e o mesmo servidor de terminal local con 1C, un volcado de ficheiros e un controlador de dominio RO virtual. Internet distribúe Mikrotik. A rama é pequena, é suficiente para eles.
Todo comezou cunha vixilancia (por falta de tempo e preguiza, non todo está supervisado), que informaba do sobrequecemento dun servidor (cunha PBX) na sucursal. Mentres os veciños resolveban o problema, o vello conxelouse e rompeu lixeiramente a base de datos MySQL.
Moitas cousas presaxiaban problemas, pero este non...
Non hai problema, a base foi reparada, todo debería funcionar. Pero os veciños quéixanse, as chamadas caen. Está ben, hai problemas en FreePBX, fago unha copia de seguridade, implanto, todo está ben.
Pero o problema está aí, os veciños seguen queixándose, as chamadas non pasan con normalidade. Antes eles, a chamada parece transcorrer con normalidade, pero cando se chaman a si mesmos ou se chaman, hai un atraso de varios segundos. Comezo a mirar os voluminosos e incomprensibles rexistros de Asterisk e FreePBX, pero non podo detectar o problema neles. Recordo que houbo un problema con STUN e ICE, que deu un atraso similar. Apago todo ao carallo, o resultado é cero.
O abatimento é o camiño para tomar malas decisións:
Estou a deprimir, xogar co ATS durante moitas horas non leva nada bo, xa é tarde e o problema non se soluciona.
Deixei o problema ata a mañá, esperando unha cabeza fresca. Pola mañá tomouse outra decisión sen éxito: como o sistema estaba roto (aínda que a dependencia non podía ser tan destrutiva), estaba tentando arranxar o sistema reinstalando todos os paquetes. O resultado é algo máis que cero, o atraso diminuíu (non significativamente, pero xa é un éxito).
Tomo outra mala decisión: se a reparación parcial do sistema operativo (e da base de datos da copia de seguranza) tivo pouco éxito e a raíz do problema aínda non está clara, e xa pasou moito tempo buscando a causa, entón decido actuar de forma radical: demolimos o SO e dámolo todo dende cero (afortunadamente, a automatización do proceso faino nun tempo aceptable). Estou acumulando a configuración de FreePBX a partir dunha copia. Outro fracaso. O resultado é cero!
Desesperación: a mente se nubla, as decisións fanse aínda peores
Estou caendo na desesperación. Comezan a vir pensamentos moi malos, penso: quizais a conf na copia de seguridade estea torcida (pasoume despois de varias actualizacións que non funcionou despois delas, e non atopei o motivo), xa non queda nada : Teño que botar todo dende cero coas mans. Que vergoña! O resultado é estrictamente cero, e moito tempo perdido!
A aceptación é o camiño cara á conciencia
En intentos desesperados por comprender o que está a suceder, comezo a estudar coidadosamente os rexistros. Noto un patrón. Unha chamada de extensión ocorre en exactamente 5 segundos, e para un grupo de chamadas de 3 extensións en 15! Comezo a buscar en Google o atraso de chamadas, pero xa indicando un atraso específico. E atopo coa resposta que xa atopei, a xente di que o problema está no DNS, pero sei con certeza que non hai ningún problema, todos os enderezos están resoltos!
Obvio - non probable
Non hai nada que facer, colle nslookup e bingo (oxalá puidese facelo de inmediato)! O DNS principal está alí (máquina virtual cun controlador), pero nin sequera me decatei! Se só houbese un DNS, habería un erro 😉
Total
Un problema elemental que se puido ver mediante a monitorización (que debería configurarse para todos os nodos), enmascarado pola tolerancia a fallos de DNS, provocou a perda de case dous días laborables para resolver unha situación estúpida. A preguiza é unha dor no cu, configurar a vixilancia leva un minuto e buscar un problema onde non o hai leva dous días.
Só os usuarios rexistrados poden participar na enquisa.
Pasouche isto algunha vez?
-
Si, moi poucas veces
-
Si, poucas veces
-
Moitas veces
-
Moi a miudo
-
Non, con ninguén, só comigo non!
-
Non, son infalible!
Votaron 2 usuarios. 1 usuario abstívose.
Fonte: www.habr.com