优云Monitor:开启数据中心主机运维的上帝视角

常常有这么一句话在激励每一位运维人员,“不以故障多为耻,而以恢复快为荣。”运维人员就是要快速定位问题,分析问题,排除故障,快速恢复来保障生产业务不受中断。然而,现代大型数据中心,运维人员要管理的系统节点比以前繁多,为了掌控数据中心的实时运行情况与定位问题,需要花的时间成本已经长得无法接受。

1.jpg

而优云Monitor给运维人员提供了极好的可视化手段,能够让运维人员在纷乱的监控资源群中快速定位故障。我们用以下几点来了解这些功能。

一、全面观察,实时监控

我们抽象的把每一个监控的主机都当成一个圆圈,有多少监控的主机,就出现多少个圈。给每一个圈圈设定一种颜色,我们就很容易区分绿色、黄色、红色。我们把绿色归为健康色,黄色归为警告色,红色归为严重不健康色。这样就能直观的观察到每一个设备的健康状况,比单纯的去看数字更加直观和有趣。下图是优云monitor对一批监控设备,以cpu使用率的维度,实时观测到的结果示意图。可以一目了然的看出大部份主机CPU使用率是正常的,而不正常的主机则非常突出,我们可以马上定位。

2.jpg

二、多种维度,上帝视角

作为高效敏捷的运维人员针对问题环境需要快速的排除障碍。每个主机设备在安装代理的时候,我们都会给它设定一个标签,用来标记这台设备的身份。比如一批设备都是用于A业务,给每个主机设备上的代理打上一个“业务:机器1”类似这种{key:value}的标签,我们在排除障碍的时候,可以根据不同的标签来分组定位分析问题。

3.jpg

上图我们通过对具有 “数据中心” 同时又具有“业务系统” 标签的设备进行分组来查看问题。观测到某个业务CPU使用率存在一个高负荷的状态,这个时候我们用鼠标滑动到圈圈上面,看到它的一个主机名称,IP,CPU使用率具体的一个数值。对于运维人员来说,这个就很容易进行针对性的解决问题。运维人员靠标记设备的方式,可以组合出多维视角来观测你的设备在不同的场景下整体的运行情况。

我们从系统的瓶颈分析,来观察我们业务系统的一个CPU使用率的一个维度视角。对于瓶颈的分析有很多的视角,尤其是对于应用层级的监控,比如oracle,mysql,tomcat,zk等等指标性能状况的瓶颈分析。如何来实现这个各种指标的性能分析呢?

三、海量指标,随需调用

优云Monitor采集了大量的指标数据,包括主机上安装的各类应用。我们可以随时过滤显示包含某类指标的节点,并用这个指标来渲染主机显示颜色。例如cassandra的应用,运维人员就可以根据cassandra的指标维度进行实时监控主机的状态。

4.jpg

之前在看TED的一个演讲,其中讲到了这么一句话:“长期与短期目标,把一个长期目标分成不同小的阶段和不同的任务种类,每完成一个阶段和任务获得奖励,才能坚持下去。”

运维的长期目标是了更好的保障服务环境的正常运行,过程中需要不断的从各个小的方面逐个突破。借助优云Monitor的三个特点,全面观察、实时监控,多种维度、深入核心,再加上海量指标作为基础保障,对资源全方位的瓶颈分析、定位,在每一个小目标过程中,都是不可或缺的力量来源,希望优云monitor的资源库可视化能帮助到更多的运维朋友。

优云全线产品免费试用:https://www.uyun.cn

原创文章,作者:uyunops,如若转载,请注明出处:http://www.178linux.com/65947

(0)
uyunopsuyunops
上一篇 2017-01-08
下一篇 2017-01-09

相关推荐

  • 系统日志和loganalyzer

    作为运维人员,熟悉系统日志是一项基本功。本文将介绍centos6的系统日志rsyslog及loganalyzer工具。 简介 系统日志:记录历史事件,通常都是按时间顺序将发生的事件予以记录,linux上的日志分为syslogd(系统进程相关日志)和klogd(内核事件日志) centos5:syslog    缺点:不能进行并行数据存储,…

    Linux干货 2016-03-20
  • Centos6.5基于SSL密码认证部署ELK(Elasticsearch+Logstash+kibana)

    1       简介 本章我们来介绍Centos6.5基于SSL密码认证部署ELK(Elasticsearch 1.4.4+Logstash 1.4.2+kibana3),同时为大家介绍如何集合如上组件来收集日志,本章的日志收集主要为大家介绍SYSTEM日志收集. 集中化日志收集主要应用场景是在同一…

    Linux干货 2015-06-18
  • xen虚拟化基础篇

    Xen介绍:  xen是一个开放的源代码虚拟机监视器,有剑桥大学研发。它打算在单个计算机上运行多达128个满足特征的操作系统,操作系统必须进行显示地修改("移植")以在Xen上运行(但是提供对用户应用的兼容性)。这使得无需特殊硬件支持,就能达到高性能的虚拟化。 Xen由三部分组成:     第一部分…

    Linux干货 2015-08-26
  • 深入浅出Docker(一):Docker核心技术预览

    原文链接:http://www.infoq.com/cn/articles/docker-core-technology-preview/ 【编者按】Docker是PaaS供应商dotCloud开源的一个基于LXC 的高级容器引擎,源代码托管在 GitHub 上,基于Go语言开发并遵从Apache2.0协议开源。Docker提供了一种在安全、可重复的环境中自…

    2015-04-10
  • 手动编译内核+busybox+dropbear+nginx

    我们需要先在宿主机上添加一个磁盘,然后,把这个磁盘做好分区和文件系统: fdisk /dev/sdb 创建第一个分区: n p 1 +512M 创建第二个分区: n p 2 +10G 保存退出: w 为分区提供文件系统: kpartx /dev/sdb 为分区提供文件系统: mke2fs -t ext4 /dev/sd…

    Linux干货 2015-09-24
  • 你的数据根本不够大,别老扯什么Hadoop了

    本文原名“Don’t use Hadoop when your data isn’t that big ”,出自有着多年从业经验的数据科学家Chris Stucchio,纽约大学柯朗研究所博士后,搞过高频交易平台,当过创业公司的CTO,更习惯称自己为统计学者。对了,他现在自己创业,提供数据分析、推荐优化咨询服务,他的邮件是:stucchio@gmail.co…

    Linux干货 2015-04-04