Europace 专访

2017年4月6日作者 Brian Brazil

在 Prometheus 用户系列专访中,我们邀请到了 Europace 公司的 Tobias Gesellchen,他将与我们分享他们是如何发现 Prometheus 的。

您能介绍一下 Europace 的业务吗?

Europace AG  开发并运营基于网络的 EUROPACE 金融市场,这是德国最大的抵押贷款、住房金融产品和个人贷款平台。一个完全集成的系统连接了约 400 个合作伙伴,包括银行、保险公司和金融产品分销商。每月有数千名用户在 EUROPACE 上执行约 35,000 笔交易,总价值高达 40 亿欧元。我们的工程师定期在 http://tech.europace.de/ @EuropaceTech  上发表博客。

在使用 Prometheus 之前,您的监控体验是怎样的?

虽然其他项目仍在使用 Nagios /Icinga ,但随着服务数量的增长和对灵活性需求的提高,我们开始寻找其他解决方案。由于 Nagios 和 Icinga 更多地依赖于集中式维护,而 Prometheus 更符合我们的目标,即让团队拥有完整的 DevOps 技术栈,并将特定的职责从基础设施团队转移到项目成员身上。

你们为什么决定研究 Prometheus?

通过参加 Docker 柏林社区  的活动,我们接触到了 SoundCloud Julius Volz ,他们为我们做了很好的概述。灵活的 Docker 容器与高度灵活的基于标签的概念相结合,说服了我们尝试 Prometheus。Prometheus 的设置非常简单,Alertmanager 也能满足我们的需求,所以我们认为没有理由再尝试其他替代方案。就连我们为了改善在 Docker 环境中以及与消息传递工具的集成而提交的一些小的拉取请求(pull requests)也很快被合并了。随着时间的推移,我们为技术栈添加了几个 exporter 和 Grafana。我们从未后悔过,也没有寻找过替代品。

Grafana dashboard for Docker Registry

你们是如何过渡的?

我们的团队在一个新项目中引入了 Prometheus,所以团队内部没有发生过渡。其他团队则从并行添加 Prometheus 到现有解决方案开始,然后逐步迁移指标收集器。在迁移过程中,自定义的 exporter 和其他临时服务提供了帮助。Grafana 已经存在,所以我们不必考虑其他的仪表盘。一些项目仍然同时使用 Icinga 和 Prometheus。

切换后你们看到了哪些改进?

由于可扩展性问题,我们使用 Icinga 时遇到了困难——多个团队维护一个集中管理的解决方案效果不佳。使用 Prometheus 技术栈以及 Alertmanager 使我们的团队和项目解耦。Alertmanager 现在能够以高可用模式 部署,这是对我们监控基础设施核心的巨大改进。

您认为 Europace 和 Prometheus 的未来会怎样?

我们公司的其他团队也逐渐在他们的项目中采用了 Prometheus。我们预计会有更多的项目引入 Prometheus 和 Alertmanager,并慢慢取代 Icinga。凭借 Prometheus 内在的灵活性,我们相信它能随着我们的需求扩展,并且我们不会在适应未来需求方面遇到问题。