IT界有一个迷信:“如果它有效,就不要碰它。” 我们的监控系统也是如此。 在南桥,我们使用 Zabbix——当我们选择它时,它非常酷。 事实上,他别无选择。
随着时间的推移,我们的生态系统已经获得了指令、额外的绑定,并且出现了与 redmine 的集成。 Zabbix 有一个强大的竞争对手,它在许多方面都表现出色:速度、几乎开箱即用的 HA、漂亮的可视化、在 kubernetes 环境中工作的优化。
但我们并不急于继续前进。 我们决定看看 Zabbix 并询问他们计划在即将发布的版本中提供哪些功能。 我们没有客气,向 Zabbix 开发总监 Sergey Sorokin 和解决方案架构师 Vitaly Zhuravlev 提出了一些令人不安的问题。 请继续阅读以了解结果。
公司的历史始于 1997 年,当时公司的创始人兼所有者 Alexey Vladyshev 在一家银行担任数据库管理员。 在阿列克谢看来,如果没有各种参数的历史值数据,如果不了解环境的当前和历史状态,管理数据库将是无效的。
同时,目前市场上的监控解决方案非常昂贵、繁琐,并且需要大量资源。 因此,Alexey 开始编写各种脚本,使他能够有效地监控委托给他的基础设施部分。 它正在变成一种爱好。 阿列克谢换了工作,但对该项目的兴趣仍然存在。 2000-2001 年,该项目从头开始重写,Alexey 考虑为其他管理员提供使用这些开发成果的机会。 同时,出现了在什么许可证下发布现有代码的问题。 Alexey 决定根据 GPLv2 许可证发布它。 该工具立即在专业环境中引起注意。 随着时间的推移,Alexey 开始收到支持、培训和扩展软件功能的请求。 此类订单的数量不断增长。 于是,很自然地,我们就做出了创建公司的决定。 公司成立于12年2005月XNUMX日
2. Zabbix发展史上有哪些要点?
目前有这样几个点:
A。 Alexey 于 1997 年开始创作剧本。
b. 根据 GPLv2 许可证发布代码 - 2001 年。
五、 Zabbix 成立于 2005 年。
d. 签订第一份合作伙伴协议,创建附属计划 - 2007 年。
d. Zabbix Japan LLC 成立 - 2012 年。
e. Zabbix LLC(美国)成立 - 2015 年
和。 Zabbix LLC 成立 - 2018 年
3. 你们有多少员工?
目前,Zabbix 集团公司拥有 70 多名员工:开发人员、测试人员、项目经理、支持工程师、顾问、销售人员和营销人员。
4. 你如何编写路线图,是否收集用户反馈? 您如何确定下一步搬到哪里?
在为Zabbix的下一版本创建Roadmap时,我们关注以下重要因素,更准确地说,我们根据以下类别收集Roadmap:
A。 Zabbix 战略改进。 Zabbix 本身认为非常重要的东西。 例如,用Go编写的Zabbix代理。
b. Zabbix 客户和合作伙伴希望在 Zabbix 中看到的东西。 并且他们愿意为此付出代价。
五、 来自 Zabbix 社区的愿望/建议。
d. 技术债务。 🙂 我们在以前的版本中发布了一些东西,但没有提供完整的功能,没有使它们足够灵活,没有提供所有选项。
5.你能比较一下Zabbix和prometheus吗? Zabbix 中什么更好、什么更差?
我们认为,主要区别在于 Prometheus 是一个主要用于收集指标的系统 - 为了在企业中收集全面的监控,有必要向 Prometheus 添加许多其他组件,例如用于可视化的 grafana、单独的长期存储,并单独管理某处的问题,单独处理日志......
Prometheus 中不会有标准的监控模板;在收到来自导出器的数千个指标后,您将需要独立查找其中有问题的信号。 设置 Prometheus - 配置文件。 在某些地方比较方便,而在另一些地方则不然。
Zabbix是一个用于创建“从和到”监控的通用平台,我们有自己的可视化、问题及其显示的关联、系统访问权限的分配、操作审计、通过代理收集数据的许多选项,代理,使用完全不同的协议,能够通过插件、脚本、模块快速扩展系统......
或者,您可以简单地按原样收集数据,例如通过 HTTP 协议,然后使用 JavaScript、JSONPath、XMLPath、CSV 等预处理函数将响应转换为有用的指标。 许多用户看重Zabbix,因为它能够通过Web界面配置和管理系统,能够以可以相互共享的模板的形式描述典型的监控配置,并且不仅包含指标,还包含检测规则,阈值、图表、描述 - 用于监视典型对象的完整对象集。
许多人还喜欢通过 Zabbix API 实现自动化管理和配置的能力。 总的来说,我不想组织一场节日。 在我们看来,这两个系统都非常适合各自的任务,并且可以和谐地互补,例如,4.2 版本的 Zabbix 可以从 Prometheus 导出器或自身收集数据。
6、有没有想过做zabbix saas?
我们考虑过,将来也会这样做,但我们希望让这个解决方案尽可能为客户提供方便。 在这种情况下,应该提供标准的 Zabbix 以及通信工具、高级数据收集工具等。
7. 我什么时候应该期待zabbix ha? 我们应该等待吗?
Zabbix HA 绝对是一个等待。 我们确实希望在 Zabbix 5.0 LTS 中看到一些东西,但到 2019 年 5.0 月 Zabbix XNUMX 路线图完全确认时,情况将会变得更加清晰。
8. 为什么媒体类型的开箱即用选择如此糟糕? 您打算添加 Slack、telegram 等吗? 还有人使用 Jabber 吗?
Jabber 在 Zabbix 4.4 中被删除,但添加了 Webhooks。 关于媒体类型,我不想从系统中制作特定的应用程序,而是想制作标准的消息传递工具。 众所周知,许多类似的聊天或桌面服务都通过 HTTP 提供 API - 因此,随着今年 4.4 的发布,情况将会改变。
随着 Zabbix 中 webhooks 的出现,您可以在不久的将来期待所有最流行的集成。 在这种情况下,集成将是双向的,而不仅仅是简单的单向通知。 而那些我们无法访问的媒体类型将由我们的社区来完成 - 因为现在整个媒体类型可以导出到配置文件并发布在 share.zabbix.com 或 github 上。 其他用户只需导入文件即可开始使用此集成。 在这种情况下,您无需安装任何其他脚本!
9、为什么虚拟机发现方向没有发展? 只有vmware。 许多人正在等待与 ec2、openstack 的集成。
不,方向是发展。 例如,在 4.4 中,数据存储发现是通过 vm.datastore.discovery 键出现的。 在 4.4 中,还出现了非常酷的 wmi.getall 键 - 我们期望通过它与 perf_counter_en 键一起,可以进行良好的 Hyper-V 监控。 那么,Zabbix 5.0 在这个方向上还会有其他重要的变化。
10. 你是否想过放弃模板并像普罗米修斯一样,当给予的一切都被拿走时?
Prometheus 自动获取所有指标,这很方便。 模板不仅仅是一组指标,它是一个“容器”,其中包含用于监视给定类型的资源或服务的所有必要的典型配置。 它已经拥有一组重要的触发器、图表、检测规则,它具有指标和阈值的描述,可以帮助用户了解正在收集的内容、正在检查哪些阈值以及原因。 同时,模板很容易与其他用户共享 - 即使他们不一定是该领域的专家,也可以对其系统进行良好的监控。
11. 为什么开箱即用的指标这么少? 从操作的角度来看,这也使设置变得非常复杂。
如果开箱即用您指的是现成的模板,那么现在我们正在努力扩展和改进我们的模板。 Zabbix 4.4 配备了新的、改进的集和更好的功能。
对于 Zabbix,您始终可以在 share.zabbix.com 上找到适用于几乎任何系统的现成模板。 但我们决定自己制作基本模板,为其他人树立榜样,也让用户免于再次为某些 MySQL 编写模板。 因此,现在在 Zabbix 中,每个版本只会有更多的官方模板。
12. 什么时候可以构建不依赖于主机的触发器,例如基于标签的触发器。 例如,我们从 n 个不同的点监控一个站点,并且我们需要一个简单的触发器,当无法从 2 个或更多点访问该站点时触发该触发器。
事实上,此类功能在 Zabbix 中已经可用多年,是为其中一个客户编写的。 客户 - ICANN。 类似的检查也可以完成,例如通过聚合项或使用 Zabbix API。 我们现在正在积极努力简化此类支票的创建。
PS:在其中一次 Slurms 中,Zabbix 开发人员询问我们希望在产品中看到什么,以便使用 Zabbix 而不是 Prometheus 来监控 Kubernetes 集群。
当开发人员与客户进行半途而废并且不再只顾自己时,这真是太好了。 现在,我们怀着真诚的兴趣迎接每个版本 - 好消息是我们谈论的越来越多的功能正在变得有血有肉。
只要开发人员不退缩,而是对客户的需求感兴趣,产品就能生存和发展。 我们将密切关注新的 Zabbix 版本。
聚苯硫醚:我们将在几个月内推出在线监控课程。 如果您有兴趣,请订阅以免错过公告。 在此期间,您可以通过我们的
来源: habr.com