优云Monitor：大规模Docker平台自动化监控之路

本文介绍了通过优云Monitor，如何实现大规模容器运维平台的自动化监控需求。

尽管Docker技术目前还处于不稳定的发展与标准制定阶段，但这门技术已经呈现了极其火热的增长状态，却已经是不争的实事。到底有多火热？让我们先来看一张来自国外监控公司DataDog 2016年最新调查报告：

从图中可以看出，自2015年5月后，采用容器技术的应用呈现了30%的大幅增长，放弃容器技术的的应用，则已经出现了平衡状态。

此消彼长，随着容器技术的推广，本文的主人公老葛，某互联网金融资深运维工程师，也开始受其波及。最近，老葛的公司开始也使用Docker来交付线上的应用了，一上来的第一个应用，就产生了50+的应用容器。老葛带领着运维与研发团队经过一趟艰难迈坑之旅，终于让线上的应用跑起来了。但成功的喜悦转瞬即逝，马上老葛的脸上又出现了囧字，如何优雅地监控容器平台，成了运维团队的大问号？

让我们跟随老葛的视角，来逐个审视团队面临的挑战，首先第一个问题是：

问题1：如何对容器的可用性与资源消耗进行监控？

经过一番选择后，老葛采用优云Monitor来作线上的容器监控，通过在Docker宿主机上部署Agent，实现了所有容器的动态监控，如下图所示：

监控代理通过获取Docker Daemon API（其本质在Docker的容器管理API与cgroup资源统计），其监控到的指标包含：运行容器数（个），停止容器数（个），容器CPU使用率（%），容器RAM使用率（%），容器磁盘读速率（B/S），容器磁盘写速率（B/S），容器文件系统大小（B）、容器文件变更大小（B）、容器网络发送速率（B/S），容器网络接收速率（B/S）。

同时Monitor Agent也针对操作系统本身进行监控，对OS、Docker的各类指标可以达到秒极的监测粒度，完全满足了团队的系统监控要求。

其次还面临：

问题2：如何对容器内的应用进行监控？

通过Monitor Agent，可以针对每一种容器应用，启用特定的采集插件，实现针对其特定应用的指标监控。如问题1中的图形所示，Agent可以通过Net端口，访问特定容器的应用，来实现应用的可用性监控与性能指标的监控。

优云Monitor支持大量的传统资源与互联网资源：

在解决上述两个问题后，工作很快走上了正轨。但应用是有生命的，它在不断发展，随着实例的增加、容器编排能力的使用，应用开始做弹性扩缩，马上新的问题又出现了：

问题3：如何对快速变更下的新增容器进行监控？

经过与优云的技术团队的沟通，老葛团队对Docker宿主机增加了容器变更触发脚本，利用Monitor Agent易于自动化配置的特性，通过脚本自动生成新容器的监控配置项，满足了对新增容器的应用自动监控。

最后，由于大量的应用使用了分布式微服务，相同的微服务在整个网络中运行了多个实例，过去再以单个应用为单位的监控已经无法满足要求，因为单个指标无法代表整个应用的性能水平，所以团队又碰到了一个监控可视化的问题：

问题4：如何可视化分布式应用的整体性能指标？

比如，目前上线的应用有6个Jetty微服务，同时还会不断增加，那么如何确认所有业务Jetty服务的负载是否均衡？

利用Agent监控时，可以为指标数据设置“来源标签”的特性，我们可以将这个应用的6个Jetty服务以及自动新增的Jetty服务，都设置上“app=shop.portal”。

然后，通过优云Monitor的多种仪表盘，通过标签可以提取到这些数据，结合奇妙的数据汇聚公式与丰富的图表，对这6个Jetty服务进行了流量访问趋势、流量访问合计、负载排名、资源消耗等可视化，如下图所示：

同时类似的问题还包括，“集群中的多个Nginx服务，总共有多少HTTP连接会话？”，“集群中所有节点当前成功处理的交易量是多少？”，“集群中所有节点的CPU利用率排名是怎样的？”等等。

从老葛团队容器监控运维历程，我们发现优云Monitor天然地支持对容器以及容器内应用的监控，并且可以敏捷的应对容器的弹性扩缩容，实现自动化容器监控。同时，Monitor还拥有非常棒的数据汇聚与可视化手段，摆脱了运维人员需要逐个面对监控指标的情况，实现监控整体应用，掌控全局。

作者简介：

蒋君伟

IT运维领域资深专家，优云软件产品总监，拥有10年运维实战经验；

先后研发了网络管理、系统管理、CMDB、ITSM等产品，并成功建设了多个全国性的网络运维管理项目；

其主导研发的产品广泛应用于海关、税务、公安、社保、银行、保险、能源等20多个行业。

“活动期：现到2016年12月31日前使用优云产品免费，欢迎详询：https://uyun.cn”

更多运维技术文章请关注优云官方微信（broada_ops）

原创文章，作者：uyunops，如若转载，请注明出处：http://www.178linux.com/28844

优云Monitor：大规模Docker平台自动化监控之路

相关推荐

制作本地yum源（以redhat5.8通过复制光盘文件到本地）

nginx基本功能学习

Ubuntu之apt-get光盘源配置小结

MySQL优化大全

Linux GNU AWK使用

vim浅谈

分享到: