.监控对运维来说是最为重要的,常用的开源监控工具可能就是zabbix和promethus。我们对比一下这两款监控工具的学习成本:
1、zabbix界面化配置部署中等,但深度定制需熟悉脚本和数据库
2、promethus配置依赖YML文件,需掌握PromQL和Exporter开发,学习曲线陡峭
做为对这两款监控工具的补充,opsone平台需要完成:
1、无需任何单独部署即可满足对服务器基础监控的需求
2、无需任何配置所见即所得哪个进程对服务器资源占用TOP
3、支持用户自定义监控及监控脚本满足用户特定需求。
这样基本可以满足运维工程师日常基本的监控和排错需求,关键是无需任何部署操作及配置。
下面就对具体的监控功能进行介绍:
首页自动显示服务器cpu使用率top3,系统load值top7,tcp连接数top7
在服务器列表页对资产和监控进行融合,主机健康程度一目了然,还可以点击查看详情
点击监控按钮可以查看12项(系统load,cpu使用率,磁盘读流量,磁盘写流量,磁盘使用率,内网入口流量,内网出口流量,公网出口带宽,公网入口带宽,内存使用率,内存使用量,tcp活动连接数)基础系统监控数据详情
可以对服务器轻松添加进程监控,只需输入进程名称即可
无需任何配置即可随时查看服务器上进程占用资源top
可以在资源组自定义监控指标,配置好的监控指标对资源组内所有服务器生效
以上这些功能基本不需配置,只要鼠标点点点即可轻松拿捏。监控涉及的内容比较多准备分2期来讲,下次重点介绍监控报警规则,报警故障自愈,监控报警通知等功能。
点击关注不迷路,感谢大家的支持!