Entretien avec Zabbix : 12 réponses franches

Il existe une superstition en informatique : « Si ça marche, n’y touchez pas. » Cela peut être dit à propos de notre système de surveillance. Chez Southbridge, nous utilisons Zabbix - lorsque nous l'avons choisi, c'était très cool. Et en fait, il n’avait pas d’alternative.

Au fil du temps, notre écosystème a acquis des instructions, des liaisons supplémentaires et l'intégration avec Redmine est apparue. Zabbix avait un concurrent puissant qui était supérieur à bien des égards : vitesse, HA presque prête à l'emploi, belle visualisation, optimisation du travail dans un environnement Kubernethes.

Mais nous ne sommes pas pressés d'avancer. Nous avons décidé de jeter un œil à Zabbix et de lui demander quelles fonctionnalités ils envisagent d'apporter dans les prochaines versions. Nous n'avons pas fait de cérémonie et avons posé des questions inconfortables à Sergey Sorokin, directeur du développement de Zabbix, et à Vitaly Zhuravlev, architecte de solutions. Lisez la suite pour découvrir ce qui en est arrivé.

Entretien avec Zabbix : 12 réponses franches

1. Parlez-nous de l’histoire de l’entreprise. Comment est née l’idée du produit ?

L'histoire de l'entreprise a commencé en 1997, lorsque le fondateur et propriétaire de l'entreprise, Alexey Vladyshev, travaillait comme administrateur de bases de données dans l'une des banques. Il a semblé à Alexey qu'il serait inefficace de gérer des bases de données sans disposer de données sur les valeurs historiques d'une grande variété de paramètres, sans comprendre l'état actuel et historique de l'environnement.

Dans le même temps, les solutions de surveillance actuellement disponibles sur le marché sont très coûteuses, lourdes et nécessitent des ressources importantes. Alexey commence donc à écrire divers scripts qui lui permettent de surveiller efficacement la partie de l'infrastructure qui lui est confiée. Cela devient un passe-temps. Alexey change de travail, mais l'intérêt pour le projet demeure. En 2000-2001, le projet a été réécrit à partir de zéro - et Alexey a pensé à donner à d'autres administrateurs la possibilité d'utiliser les développements. Dans le même temps, la question s'est posée sous quelle licence publier le code existant. Alexey a décidé de le publier sous licence GPLv2. L’outil a été immédiatement remarqué en milieu professionnel. Au fil du temps, Alexey a commencé à recevoir des demandes d'assistance, de formation et d'extension des capacités du logiciel. Le nombre de ces commandes ne cessait de croître. Alors, tout naturellement, la décision de créer une entreprise est venue. La société a été fondée le 12 avril 2005

Entretien avec Zabbix : 12 réponses franches

2. Quels points clés pouvez-vous souligner dans l'histoire du développement de Zabbix ?

Il existe actuellement plusieurs de ces points :
UN. Alexey a commencé à travailler sur des scénarios en 1997.
b. Publication du code sous licence GPLv2 - 2001.
V. Zabbix a été fondée en 2005.
d. Conclusion des premiers accords de partenariat, création d'un programme d'affiliation - 2007.
d. Création de Zabbix Japan LLC - 2012.
e. Création de Zabbix LLC (USA) - 2015
et. Création de Zabbix LLC - 2018

3. Combien de personnes employez-vous ?

À l'heure actuelle, le groupe de sociétés Zabbix emploie un peu plus de 70 employés : développeurs, testeurs, chefs de projet, ingénieurs support, consultants, commerciaux et employés marketing.

4. Comment rédigez-vous une feuille de route, recueillez-vous les retours des utilisateurs ? Comment déterminez-vous où déménager ensuite ?

Lors de la création d'une feuille de route pour la prochaine version de Zabbix, nous nous concentrons sur les facteurs importants suivants, plus précisément, nous collectons les feuilles de route selon les catégories suivantes :

UN. Améliorations stratégiques de Zabbix. Quelque chose que Zabbix lui-même considère comme très important. Par exemple, l'agent Zabbix écrit en Go.
b. Ce que les clients et partenaires de Zabbix veulent voir dans Zabbix. Et pour lequel ils sont prêts à payer.
V. Souhaits/suggestions de la communauté Zabbix.
d) Dettes techniques. 🙂 Les éléments que nous avons publiés dans les versions précédentes, mais qui n'offraient pas toutes les fonctionnalités, ne les rendaient pas suffisamment flexibles, n'offraient pas toutes les options.

Entretien avec Zabbix : 12 réponses franches

5. Pouvez-vous comparer Zabbix et Prometheus ? Qu'est-ce qui est meilleur et qu'est-ce qui est pire dans Zabbix ?

La principale différence, à notre avis, est que Prometheus est principalement un système destiné à collecter des métriques - et pour collecter une surveillance à part entière dans une entreprise, il est nécessaire d'ajouter de nombreux autres composants à Prometheus, tels que grafana pour la visualisation, un Séparez le stockage à long terme et séparez les problèmes de gestion quelque part, travaillez avec les journaux séparément...

Il n'y aura pas de modèles de surveillance standard dans Prometheus ; après avoir reçu les milliers de mesures des exportateurs, vous devrez y trouver de manière indépendante des signaux problématiques. Configuration de Prometheus - fichiers de configuration. Dans certains endroits, c'est plus pratique, dans d'autres, ce n'est pas le cas.

Zabbix est une plateforme universelle pour créer un suivi "de et vers", nous avons notre propre visualisation, corrélation des problèmes et leur affichage, répartition des droits d'accès au système, audit des actions, de nombreuses options de collecte de données via un agent, proxy, utilisant des protocoles complètement différents, la possibilité d'étendre rapidement le système avec des plugins, des scripts, des modules...

Ou vous pouvez simplement collecter les données telles quelles, par exemple via le protocole HTTP, puis transformer les réponses en métriques utiles à l'aide de fonctions de prétraitement telles que JavaScript, JSONPath, XMLPath, CSV, etc. De nombreux utilisateurs apprécient Zabbix pour sa capacité à configurer et à gérer le système via une interface Web, pour sa capacité à décrire des configurations de surveillance typiques sous la forme de modèles pouvant être partagés entre eux et contenant non seulement des métriques, mais également des règles de détection, valeurs seuils, graphiques, descriptions - un ensemble complet d'objets pour surveiller des objets typiques.

De nombreuses personnes apprécient également la possibilité d'automatiser la gestion et la configuration via l'API Zabbix. En général, je ne veux pas organiser de holivar. Il nous semble que les deux systèmes sont bien adaptés à leurs tâches et peuvent se compléter harmonieusement, par exemple, Zabbix à partir de la version 4.2 peut collecter des données auprès des exportateurs Prometheus ou de lui-même.

6. Avez-vous pensé à créer des Saas Zabbix ?

Nous y avons réfléchi et le ferons à l'avenir, mais nous souhaitons rendre cette solution aussi pratique que possible pour les clients. Dans ce cas, le Zabbix standard devrait être proposé ainsi que des outils de communication, des outils avancés de collecte de données, etc.

7. Quand dois-je m'attendre à zabbix ha ? Et faut-il attendre ?

Zabbix HA est définitivement une attente. Nous espérons vraiment voir quelque chose dans Zabbix 5.0 LTS, mais la situation deviendra plus claire en novembre 2019 lorsque la feuille de route Zabbix 5.0 sera entièrement confirmée.

8. Pourquoi les types de médias proposent-ils une si mauvaise sélection dès le départ ? Envisagez-vous d'ajouter Slack, Telegram, etc. ? Est-ce que quelqu'un d'autre utilise Jabber ?

Jabber a été supprimé dans Zabbix 4.4, mais des Webhooks ont été ajoutés. Concernant les types de médias, je ne souhaite pas créer d'applications spécifiques à partir du système, mais des outils de messagerie standards. Ce n'est un secret pour personne que de nombreux services de chat ou de bureau similaires disposent d'une API via HTTP - donc cette année, avec la sortie de la version 4.4, la situation va changer.

Avec l'avènement des webhooks dans Zabbix, vous pouvez vous attendre à toutes les intégrations les plus populaires prêtes à l'emploi dans un avenir proche. Dans ce cas, l’intégration sera bidirectionnelle, et pas seulement de simples notifications unidirectionnelles. Et les types de médias auxquels nous ne pouvons pas accéder seront créés par notre communauté - car désormais, le type de média entier peut être exporté vers un fichier de configuration et publié sur share.zabbix.com ou github. Et les autres utilisateurs n'auront qu'à importer le fichier pour commencer à utiliser cette intégration. Dans ce cas, vous n’avez pas besoin d’installer de scripts supplémentaires !

9. Pourquoi la direction de la découverte de machines virtuelles ne se développe-t-elle pas ? Il n'y a que VMware. Beaucoup attendent l'intégration avec ec2, openstack.

Non, la direction évolue. Par exemple, dans la version 4.4, la découverte de banque de données est apparue via la clé vm.datastore.discovery. Dans la version 4.4, des clés wmi.getall très intéressantes sont également apparues - nous espérons que grâce à elles, avec la clé perf_counter_en, il sera possible d'effectuer une bonne surveillance Hyper-V. Eh bien, il y aura d'autres changements importants dans ce sens dans Zabbix 5.0.

Entretien avec Zabbix : 12 réponses franches

10. Avez-vous pensé à abandonner les modèles et à faire comme prometeus, quand tout ce qui est donné est retiré ?

Prometheus prend automatiquement toutes les métriques, c'est pratique. Et un modèle est plus qu'un simple ensemble de métriques, c'est un « conteneur » qui contient toute la configuration typique nécessaire pour surveiller un type donné de ressource ou de service. Il dispose déjà d'un ensemble de déclencheurs, de graphiques et de règles de détection importants, ainsi que de descriptions de métriques et de seuils qui aident l'utilisateur à comprendre ce qui est collecté, quels seuils sont vérifiés et pourquoi. Dans le même temps, les modèles sont faciles à partager avec d'autres utilisateurs - et ils bénéficieront d'une bonne surveillance de leur système, même sans nécessairement en être un expert.

11. Pourquoi y a-t-il si peu de mesures prêtes à l’emploi ? Cela complique également grandement la configuration du point de vue opérationnel.

Si vous parlez de modèles prêts à l'emploi, nous travaillons actuellement à l'expansion et à l'amélioration de nos modèles. Zabbix 4.4 est livré avec un nouvel ensemble amélioré et de meilleures fonctionnalités.

Pour Zabbix, vous pouvez toujours trouver un modèle prêt à l'emploi pour presque tous les systèmes sur share.zabbix.com. Mais nous avons décidé que nous devions créer nous-mêmes des modèles de base, en donnant l'exemple aux autres, et en libérant également les utilisateurs de l'écriture d'un modèle pour certains MySQL. Par conséquent, désormais dans Zabbix, il n'y aura que des modèles plus officiels avec chaque version.

Entretien avec Zabbix : 12 réponses franches

12. Quand sera-t-il possible de créer des déclencheurs qui ne sont pas liés aux hôtes, mais, par exemple, basés sur des étiquettes. Par exemple, nous surveillons un site à partir de n points différents et nous voulons un déclencheur simple qui se déclenche lorsque le site n'est pas accessible à partir de 2 points ou plus.

En fait, une telle fonctionnalité est disponible dans Zabbix depuis plusieurs années, écrite pour l'un des clients. Client - ICANN. Des vérifications similaires peuvent également être effectuées, par exemple via des éléments agrégés ou à l'aide de l'API Zabbix. Nous travaillons désormais activement à simplifier la création de tels contrôles.

PS: Lors de l'un des Slurms, les développeurs de Zabbix nous ont demandé ce que nous voulions voir dans le produit afin de surveiller les clusters Kubernetes à l'aide de Zabbix, et non de Prometheus.

C'est formidable lorsque les développeurs rencontrent les clients à mi-chemin et ne restent pas une chose pour eux-mêmes. Et maintenant, nous accueillons chaque version avec un intérêt sincère - la bonne nouvelle est que de plus en plus de fonctionnalités dont nous avons parlé deviennent chair et sang.

Tant que les développeurs ne se replient pas sur eux-mêmes, mais s'intéressent aux besoins des clients, le produit vit et se développe. Nous garderons un œil sur les nouvelles versions de Zabbix.

PPS: Nous lancerons dans quelques mois un cours de surveillance en ligne. Si vous êtes intéressé, abonnez-vous pour ne pas rater l'annonce. En attendant, vous pouvez consulter notre Slurm sur Kubernetes.

Source: habr.com

Ajouter un commentaire