Buscando un problema no lugar equivocado

Esta é unha pequena historia da práctica real, cando un pequeno problema, ben disfrazado pola tolerancia ás fallas, se converte nunha dor de cabeza.

Disposición pequena:

Unha pequena sucursal, ten a súa propia PBX (asterisco + FreePBX) baseada en hardware de escritorio e o mesmo servidor de terminal local con 1C, un volcado de ficheiros e un controlador de dominio RO virtual. Internet distribúe Mikrotik. A rama é pequena, é suficiente para eles.
Todo comezou cunha vixilancia (por falta de tempo e preguiza, non todo está supervisado), que informaba do sobrequecemento dun servidor (cunha PBX) na sucursal. Mentres os veciños resolveban o problema, o vello conxelouse e rompeu lixeiramente a base de datos MySQL.

Moitas cousas presaxiaban problemas, pero este non...

Non hai problema, a base foi reparada, todo debería funcionar. Pero os veciños quéixanse, as chamadas caen. Está ben, hai problemas en FreePBX, fago unha copia de seguridade, implanto, todo está ben.
Pero o problema está aí, os veciños seguen queixándose, as chamadas non pasan con normalidade. Antes eles, a chamada parece transcorrer con normalidade, pero cando se chaman a si mesmos ou se chaman, hai un atraso de varios segundos. Comezo a mirar os voluminosos e incomprensibles rexistros de Asterisk e FreePBX, pero non podo detectar o problema neles. Recordo que houbo un problema con STUN e ICE, que deu un atraso similar. Apago todo ao carallo, o resultado é cero.

O abatimento é o camiño para tomar malas decisións:

Estou a deprimir, xogar co ATS durante moitas horas non leva nada bo, xa é tarde e o problema non se soluciona.
Deixei o problema ata a mañá, esperando unha cabeza fresca. Pola mañá tomouse outra decisión sen éxito: como o sistema estaba roto (aínda que a dependencia non podía ser tan destrutiva), estaba tentando arranxar o sistema reinstalando todos os paquetes. O resultado é algo máis que cero, o atraso diminuíu (non significativamente, pero xa é un éxito).
Tomo outra mala decisión: se a reparación parcial do sistema operativo (e da base de datos da copia de seguranza) tivo pouco éxito e a raíz do problema aínda non está clara, e xa pasou moito tempo buscando a causa, entón decido actuar de forma radical: demolimos o SO e dámolo todo dende cero (afortunadamente, a automatización do proceso faino nun tempo aceptable). Estou acumulando a configuración de FreePBX a partir dunha copia. Outro fracaso. O resultado é cero!

Desesperación: a mente se nubla, as decisións fanse aínda peores

Estou caendo na desesperación. Comezan a vir pensamentos moi malos, penso: quizais a conf na copia de seguridade estea torcida (pasoume despois de varias actualizacións que non funcionou despois delas, e non atopei o motivo), xa non queda nada : Teño que botar todo dende cero coas mans. Que vergoña! O resultado é estrictamente cero, e moito tempo perdido!

A aceptación é o camiño cara á conciencia

En intentos desesperados por comprender o que está a suceder, comezo a estudar coidadosamente os rexistros. Noto un patrón. Unha chamada de extensión ocorre en exactamente 5 segundos, e para un grupo de chamadas de 3 extensións en 15! Comezo a buscar en Google o atraso de chamadas, pero xa indicando un atraso específico. E atopo coa resposta que xa atopei, a xente di que o problema está no DNS, pero sei con certeza que non hai ningún problema, todos os enderezos están resoltos!

Obvio - non probable

Non hai nada que facer, colle nslookup e bingo (oxalá puidese facelo de inmediato)! O DNS principal está alí (máquina virtual cun controlador), pero nin sequera me decatei! Se só houbese un DNS, habería un erro 😉

Total

Un problema elemental que se puido ver mediante a monitorización (que debería configurarse para todos os nodos), enmascarado pola tolerancia a fallos de DNS, provocou a perda de case dous días laborables para resolver unha situación estúpida. A preguiza é unha dor no cu, configurar a vixilancia leva un minuto e buscar un problema onde non o hai leva dous días.

Só os usuarios rexistrados poden participar na enquisa. Rexístrate, por favor.

Pasouche isto algunha vez?

  • Si, moi poucas veces

  • Si, poucas veces

  • Moitas veces

  • Moi a miudo

  • Non, con ninguén, só comigo non!

  • Non, son infalible!

Votaron 2 usuarios. 1 usuario abstívose.

Fonte: www.habr.com

Engadir un comentario