Intervista a Zabbix: 12 risposte schiette

C’è una superstizione nell’IT: “Se funziona, non toccarlo”. Questo si può dire del nostro sistema di monitoraggio. A Southbridge utilizziamo Zabbix: quando l'abbiamo scelto, è stato fantastico. E, in effetti, non aveva alternative.

Nel tempo, il nostro ecosistema ha acquisito istruzioni, collegamenti aggiuntivi ed è apparsa l'integrazione con Redmine. Zabbix aveva un potente concorrente che era superiore sotto molti aspetti: velocità, HA quasi fuori dagli schemi, bella visualizzazione, ottimizzazione del lavoro in un ambiente Kubernethes.

Ma non abbiamo fretta di andare avanti. Abbiamo deciso di dare un'occhiata a Zabbix e chiedere quali funzionalità intendono introdurre nelle prossime versioni. Non abbiamo fatto cerimonie e posto domande scomode a Sergey Sorokin, direttore dello sviluppo di Zabbix, e Vitaly Zhuravlev, Solution architect. Continua a leggere per scoprire cosa ne è venuto fuori.

Intervista a Zabbix: 12 risposte schiette

1. Raccontaci la storia dell'azienda. Come è nata l’idea del prodotto?

La storia dell'azienda è iniziata nel 1997, quando il fondatore e proprietario dell'azienda, Alexey Vladyshev, ha lavorato come amministratore di database in una delle banche. Ad Alexey sembrava che sarebbe stato inefficace gestire i database senza avere dati sui valori storici di un'ampia varietà di parametri, senza comprendere lo stato attuale e storico dell'ambiente.

Allo stesso tempo, le soluzioni di monitoraggio attualmente sul mercato sono molto costose, ingombranti e richiedono grandi risorse. Alexey inizia quindi a scrivere vari script che gli consentono di monitorare efficacemente la parte dell'infrastruttura che gli è stata affidata. Si sta trasformando in un hobby. Alexey cambia lavoro, ma l'interesse per il progetto rimane. Nel 2000-2001, il progetto è stato riscritto da zero e Alexey ha pensato di dare ad altri amministratori l'opportunità di utilizzare gli sviluppi. Allo stesso tempo, è sorta la domanda con quale licenza rilasciare il codice esistente. Alexey ha deciso di rilasciarlo sotto la licenza GPLv2. Lo strumento è stato immediatamente notato in un ambiente professionale. Nel corso del tempo, Alexey ha iniziato a ricevere richieste di supporto, formazione e ampliamento delle capacità del software. Il numero di tali ordini era in costante crescita. Quindi, naturalmente, è arrivata la decisione di creare un'azienda. La società è stata fondata il 12 aprile 2005

Intervista a Zabbix: 12 risposte schiette

2. Quali punti chiave puoi evidenziare nella storia dello sviluppo di Zabbix?

Attualmente ci sono diversi punti di questo tipo:
UN. Alexey ha iniziato a lavorare sulle sceneggiature nel 1997.
B. Pubblicazione del codice sotto licenza GPLv2 - 2001.
V. Zabbix è stata fondata nel 2005.
d. Conclusione dei primi accordi di partnership, creazione di un programma di affiliazione - 2007.
d. Fondazione di Zabbix Japan LLC - 2012.
e. Fondazione di Zabbix LLC (USA) - 2015
E. Fondazione di Zabbix LLC - 2018

3. Quante persone impiegate?

Al momento, il gruppo di società Zabbix impiega poco più di 70 dipendenti: sviluppatori, tester, project manager, ingegneri di supporto, consulenti, addetti alle vendite e addetti al marketing.

4. Come scrivi una roadmap, raccogli feedback dagli utenti? Come determini dove spostarti dopo?

Quando creiamo una Roadmap per la prossima versione di Zabbix, ci concentriamo sui seguenti fattori importanti, più precisamente, raccogliamo Roadmap secondo le seguenti categorie:

UN. Miglioramenti strategici di Zabbix. Qualcosa che la stessa Zabbix considera molto importante. Ad esempio, l'agente Zabbix scritto in Go.
B. Cose che i clienti e i partner Zabbix vogliono vedere in Zabbix. E per il quale sono disposti a pagare.
V. Desideri/suggerimenti dalla comunità Zabbix.
d.Debiti tecnici. 🙂 Cose che abbiamo rilasciato nelle versioni precedenti, ma che non fornivano la piena funzionalità, non le rendevano sufficientemente flessibili, non offrivano tutte le opzioni.

Intervista a Zabbix: 12 risposte schiette

5. Puoi paragonare Zabbix e Prometeo? Cosa è meglio e cosa è peggio in Zabbix?

La differenza principale, a nostro avviso, è che Prometheus è un sistema principalmente per la raccolta di parametri e per raccogliere un monitoraggio completo in un'azienda è necessario aggiungere molti altri componenti a Prometheus, come grafana per la visualizzazione, un archiviazione separata a lungo termine e gestione separata da qualche parte problemi, lavorare con i registri separatamente...

Non ci saranno modelli di monitoraggio standard in Prometheus; dopo aver ricevuto tutte le migliaia di parametri dagli esportatori, dovrai trovare in modo indipendente i segnali problematici al loro interno. Configurazione di Prometheus: file di configurazione. In alcuni posti è più conveniente, in altri no.

Zabbix è una piattaforma universale per creare monitoraggio “da e verso”, abbiamo la nostra visualizzazione, correlazione dei problemi e la loro visualizzazione, distribuzione dei diritti di accesso al sistema, audit delle azioni, molte opzioni per la raccolta dei dati tramite un agente, proxy, utilizzando protocolli completamente diversi, la capacità di espandere rapidamente il sistema con plugin, script, moduli...

Oppure puoi semplicemente raccogliere i dati così come sono, ad esempio tramite il protocollo HTTP, e quindi trasformare le risposte in metriche utili utilizzando funzioni di preelaborazione come JavaScript, JSONPath, XMLPath, CSV e simili. Molti utenti apprezzano Zabbix per la capacità di configurare e gestire il sistema tramite un'interfaccia web, per la capacità di descrivere tipiche configurazioni di monitoraggio sotto forma di modelli che possono essere condivisi tra loro e contenenti non solo metriche, ma anche regole di rilevamento, valori di soglia, grafici, descrizioni: un set completo di oggetti per il monitoraggio di oggetti tipici.

A molte persone piace anche la possibilità di automatizzare la gestione e la configurazione tramite l'API Zabbix. In generale, non voglio organizzare un holivar. Ci sembra che entrambi i sistemi siano adatti ai loro compiti e possano completarsi armoniosamente a vicenda, ad esempio Zabbix dalla versione 4.2 può raccogliere dati dagli esportatori Prometheus o da se stesso.

6. Hai pensato di realizzare zabbix saas?

Ci abbiamo pensato e lo faremo in futuro, ma vogliamo rendere questa soluzione il più conveniente possibile per i clienti. In questo caso, dovrebbe essere offerto Zabbix standard insieme a strumenti di comunicazione, strumenti avanzati di raccolta dati e così via.

7. Quando dovrei aspettarmi zabbix ah? Dovrei aspettare?

Zabbix HA è sicuramente un'attesa. Speriamo davvero di vedere qualcosa in Zabbix 5.0 LTS, ma la situazione diventerà più chiara a novembre 2019 quando la Roadmap di Zabbix 5.0 sarà pienamente confermata.

8. Perché il tipo di supporto ha una selezione così scarsa di default? Hai intenzione di aggiungere Slack, Telegram, ecc.? Qualcun altro usa Jabber?

Jabber è stato rimosso in Zabbix 4.4, ma sono stati aggiunti i Webhook. Per quanto riguarda i tipi di media, non vorrei creare applicazioni specifiche dal sistema, ma strumenti di messaggistica standard. Non è un segreto che molte chat o servizi desk simili dispongano di un'API tramite HTTP, quindi quest'anno con il rilascio della 4.4 la situazione cambierà.

Con l'avvento dei webhook in Zabbix, puoi aspettarti tutte le integrazioni più popolari pronte all'uso nel prossimo futuro. In questo caso l’integrazione sarà bidirezionale e non semplici notifiche unidirezionali. E quei tipi di media che non possiamo raggiungere verranno gestiti dalla nostra comunità, perché ora l'intero tipo di media può essere esportato in un file di configurazione e pubblicato su share.zabbix.com o github. E gli altri utenti dovranno solo importare il file per iniziare a utilizzare questa integrazione. In questo caso non è necessario installare script aggiuntivi!

9. Perché la direzione di rilevamento della macchina virtuale non viene sviluppata? C'è solo vmware. Molti aspettano l'integrazione con ec2, openstack.

No, la direzione si sta sviluppando. Ad esempio, nella versione 4.4, il rilevamento del datastore veniva effettuato tramite la chiave vm.datastore.discovery. Nella versione 4.4 sono apparse anche delle chiavi wmi.getall molto interessanti: prevediamo che attraverso di essa, insieme alla chiave perf_counter_en, sarà possibile eseguire un buon monitoraggio Hyper-V. Ebbene, ci saranno altri importanti cambiamenti in questa direzione in Zabbix 5.0.

Intervista a Zabbix: 12 risposte schiette

10. Hai pensato di abbandonare gli schemi e di fare come Prometeo, quando tutto ciò che viene dato ti viene tolto?

Prometheus prende automaticamente tutte le metriche, questo è conveniente. E un modello è più di un semplice insieme di parametri, è un “contenitore” che contiene tutta la configurazione tipica necessaria per monitorare un determinato tipo di risorsa o servizio. Dispone già di una serie di trigger, grafici, regole di rilevamento importanti, descrizioni di metriche e soglie che aiutano l'utente a capire cosa viene raccolto, quali soglie vengono controllate e perché. Allo stesso tempo, i modelli sono facili da condividere con altri utenti e questi otterranno un buon monitoraggio del proprio sistema, anche senza essere necessariamente un esperto.

11. Perché ci sono così pochi parametri pronti all'uso? Ciò complica notevolmente la configurazione anche dal punto di vista operativo.

Se fuori dagli schemi intendi modelli già pronti, in questo momento stiamo lavorando per espandere e migliorare i nostri modelli. Zabbix 4.4 viene fornito con un set nuovo e migliorato e funzionalità migliori.

Per Zabbix puoi sempre trovare un modello già pronto per quasi tutti i sistemi su share.zabbix.com. Ma abbiamo deciso che avremmo dovuto creare noi stessi i modelli di base, dando l'esempio agli altri e liberando gli utenti dalla necessità di scrivere ancora una volta un modello per alcuni MySQL. Pertanto, ora in Zabbix ci saranno solo più modelli ufficiali con ogni versione.

Intervista a Zabbix: 12 risposte schiette

12. Quando sarà possibile costruire trigger non legati agli host, ma, ad esempio, basati su etichette. Ad esempio, monitoriamo un sito da n punti diversi e vogliamo un semplice trigger che si attivi quando il sito non è accessibile da 2 o più punti.

In effetti, tale funzionalità è disponibile in Zabbix da diversi anni, scritta per uno dei clienti. Cliente: ICANN. Controlli simili possono essere effettuati anche, ad esempio, tramite elementi aggregati o utilizzando le API Zabbix. Stiamo ora lavorando attivamente per semplificare la creazione di tali controlli.

PS: In uno degli Slurm, gli sviluppatori di Zabbix ci hanno chiesto cosa volevamo vedere nel prodotto per monitorare i cluster Kubernetes utilizzando Zabbix e non Prometheus.

È fantastico quando gli sviluppatori incontrano i clienti a metà strada e non rimangono una cosa per se stessi. E ora salutiamo ogni versione con sincero interesse: la buona notizia è che sempre più funzionalità di cui abbiamo parlato stanno diventando carne e ossa.

Finché gli sviluppatori non si chiudono in se stessi, ma sono interessati alle esigenze dei clienti, il prodotto vive e si sviluppa. Terremo d'occhio le nuove versioni di Zabbix.

PPS: Tra pochi mesi lanceremo un corso di monitoraggio online. Se sei interessato iscriviti per non perdere l'annuncio. Nel frattempo potete consultare il nostro Slurm su Kubernetes.

Fonte: habr.com

Aggiungi un commento