1 概述

1.1 背景介绍

应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。

1.2 适用对象

  • 企业
  • 个人开发者
  • 高校学生

1.3 案例时间

本次案例总时长预计60分钟。

1.4 案例流程

AOM.png{{{width="65%" height="auto"}}}

说明:

① 用户购买弹性云服务器ECS,并将服务部署上去; ② ECS虚拟机上安装ICAgent采集用户虚拟机指标数据上传至AOM服务; ③ 应用运维管理服务AOM采集指标数据并通过可视化图标形式展现给用户; ④ 应用运维管理服务AOM配置指标监控,产生告警后通过消息通知服务SMN服务通知到用户邮箱。

1.5 资源总览

本次案例预计花费总计1.0元。

资源名称 规格 单价(元) 时长(h)
弹性云服务器ECS X86计算,通用计算增强型 | c7.large.2 | 2 vCPUs | 4 GiB CentOS 7.6 64bit (40GB) 0.6 1
应用运维管理AOM 按需计费 1百万次 0.9元/天 1
消息通知服务SMN 电子邮件方式 1000封以下免费 2元/1000封 1
CodeArts服务 免费体验版 免费 1

2 资源接入AOM并配置可视化图表

2.1 前置条件

请参考“基于云主机的CodeArts IDE运行Java电商项目”确保在ECS虚拟机上已部署了自己的电商项目应用,并且可以正常运行以及产出日志。

2.2 使用AOM对资源进行接入管理

登录华为云首页,在搜索框中输入“应用运维管理 AOM”,查询出应用运维管理服务AOM,点击“控制台”按钮,跳转到应用运维管理服务首页。

e0165ac60a9cfd13cc065e14a252d09a.png

如果进入的是下图AOM1.0版本,请点击左下侧的“体验新版”跳转到新版AOM服务。

26ef06875960d16923936d7e625b5b7e.png

进入AOM服务页面后,点击左下的“设置”。 2.2-3.png

点击“菜单开关”,将“概览”开关按钮打开。 2.2-4.png

返回,点击“概览”。

066495e6ca66684a11f3ac166d215a41.png

在AOM概览首页,点击“应用视角->创建应用”。

3c31bdd156714d848696e343c7121c1f.png

进入应用资源管理页面,点击右上角的“创建应用”。

e5f8aac9f0393b05d7fb32389e5608db.png

根据提示填写应用信息,确认。

0fb6fbb0199e6be83797e3a0a6b68dd6.png

然后点击“点击接入组件”按钮。

a9eb6b9bc199160ca492af2e15fee067.png

填入组件名称,确认。

9f719633aa9342f0c86d0148ff42fffa.png

点击“接入环境”按钮。

04977de5d76ced6eea3736089bc488a1.png

根据提示填写环境信息,确认。

2b5ce13fad199d1aa5dedf79242b83c5.png

点击“关联资源”按钮。

28210996f84dfe36488bbbd468bcfdd1.png

选择自己待接入的ECS虚拟机,然后点击“关联资源&安装Agent”按钮。

313956cc41a80323083d79602c0a8066.png

如果机器没有安装UniAgent,需要点击“手动安装”进行手动安装。

117432b72e0466f874a51c8198d1121f.png

点击“复制”图标进行命令复制。

c75d286458a7191d87922c6d64f3b0f6.png

跳转到弹性云服务器ECS服务首页,点击我们部署应用的虚拟机的“远程登录”按钮。

566615aad280c22c786809cf6764e639.png

弹出框滑到最下面,选择VNC方式登录,

4a1129d0236326e686e019abd1167048.png

使用root账户登录,然后输入密码,登录到虚拟机。

输入:

cd /opt

回车,跳转到opt目录下,输入:

mkdir AOM

回车,创建APM文件夹,输入:

cd AOM

回车,进入AOM文件夹,然后输入刚刚复制的UniAgent安装命令,回车。

6a44ea7d74e9dacd0bd0c1859e59d6a8.png

出现以上日志即完成了资源的接入与UniAgent的安装。 2.2-21.png

2.3 服务器上安装ICAgent

ICAgent是指标采集工具,使用AOM服务采集主机的指标数据时,需要安装ICAgent。

ICAgent的安装步骤具体可参考“云日志服务 LTS”服务的安装步骤提示。

在云日志服务首页,点击左侧菜单栏中的“主机管理”,然后点击下拉菜单中的“主机”跳转到日志接入页面。

9142c774e774b5195c2ddd7542af8d10.png

在主机页面点击右上角的“ICAgent”按钮,查看ICAgent安装步骤。 2.2-7.png

本实验主要以Linux虚拟机安装ICAgent来做演示。

e558b6fd23486f831f980347a3533773.png

2.3.1 步骤一 获取AK和SK

参考如何获取AK和SK来获取AK/SK。

2.3.2 步骤二 复制ICAgent命令

复制服务自动生成的ICAgent命令,注意要根据提示将其中的 {input_your_ak} 和 {input_your_sk}替换成步骤一中获取的AK/SK。

2.3.3 步骤三 执行安装ICAgent命令

登录我们部署服务的ECS机器上,然后输入步骤二复制的ICAgent命令,回车执行。显示如下图表示ICAgent安装成功。

34712ffff674e30e4eaa699eab00310b.png

2.4 查看资源指标

在应用运维管理服务首页,点击“监控中心”,跳转到监控中心页面。

f18cad587241d6bb9c6ae292f4e09540.png

点击“指标浏览”,Prometheus实例选择“Prometheus_AOM_Default”指标(AOM采集的基本指标都存放在Prometheus_AOM_Default中),比如我们想查看虚拟机的CPU使用情况,就选择“aom_node_cpu_usage”,筛选条件选择“主机名称”,然后选择自己的虚拟机,即可在控制台页面上查看到虚拟机的CPU使用率情况。

dc2b4c5ebae99fc1785a47f9d649bf8d.png

2.5 指标可视化图标创建

点击“仪表盘 -> 创建仪表盘”。

70a995e92a95cd020305a36e546e7f46.png

根据提示填写仪表盘信息,然后确认。 2.5-2.png

点击右上角的“添加图标”图标按钮(或者下面的添加图表按钮),进行图表添加。

9e309a0d9897e7ab29c47cfe1e576887.png

填入图表标题,以创建CPU指标图表为例,选择折线图,指标选择“aom_node_cpu_suage”,条件选择“主机名称”,然后选择自己的虚拟机,点击“保存”,

d937824e90969a285dc6557bf4541c6b.png

即完成了指标图表化的创建。

33bd970b8a69114d5ebdd740e2d1d99f.png

3 配置告警

自动化运维服务 (Automation) 作为AOM的自动化运维平台,依托华为云UniAgent运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。

3.1 消息通知配置与订阅

在华为云首页的搜索框中输入“消息通知服务 SMN”,点击“控制台”,登录到消息通知服务SMN首页。

432ffcf0e1e8bb040997562bf3d61393.png

点击“主题”,进入主题列表详情页面。

3075b15966277faec9c03d44c8b76c2c.png

点击右上角的“创建主题”按钮,进行主题创建。

5cbfa0c3e8bb84d4f0ab486277886ac1.png

填写主题的基本信息。

e53f481ac701be5b2fd27b610e64f58f.png

主题创建完后,点击主题后面的“添加订阅”按钮。

d977bd726eaed8c46a3955d03f0c930b.png

协议选择邮箱,终端中填写自己的邮箱即可。

10c473f9c4cd7bdc39b043a85ac53088.png

登录自己输入的邮箱,确认消息订阅。

6566ef5a03ef2f51a31e6837ad24a80b.png

订阅成功。 3.1.png

3.2 指标告警配置

在AOM的指标页点击“告警管理->告警行动规则”,然后点击“创建告警行动规则”按钮进行告警行动规则的创建,基本信息按需求填写,需要注意的是“行动规则类型”选择“指标或事件”,行动方式选择“通知”,主题选择3.1创建的主题,消息模板点击超链接进行创建。

3.2-1.png

消息模板创建参考下图:

971e9e596a26c3ed69e09b6a683cfcd1.png

告警行动规则创建完毕后,点击“告警管理->告警规则”,点击“创建”按钮进行告警规则的创建。

3.2-2.png 自定义填写规则名称和企业项目,本案例中告警规则设置选择“指标告警规则”,配置方式选择“全量指标”,Prometheuse实例选择“Prometheuse_AOM_Default”。

8006f609db47de6405f453c1fc34dd7a.png

告警规则详细选择“多指标”,指标信息与2.4相同,配置我们需要监听的虚拟机的CPU,为了测试我们选择CPU使用率大于1%即触发告警。

31dc56cc463432453e401bfc7a74c798.png

告警设置中,告警通知场景选择“告警触发时”和“告警恢复时”,告警方式选择“直接告警”,通知频率选择“只告警一次”,行动规则选择之前创建好的规则。

1eb2d92591c34e35edf4f11636cefb5e.png

点击“立即创建”,即完成告警规则的创建。

29242ac4f67daac648d158af53cd3d9b.png

3.3 查看指标异常告警

f8b533532b76b57f15b09139cfe49597.png

5f4439b8c7271eb7c2b68cb3d7f8d072.png

以及告警邮件信息。

59355b7c5bb27a0a97f8a6f00c94f766.png 至此,基于电商项目的应用运维管理AOM实操全部结束。

Logo

电商企业物流数字化转型必备!快递鸟 API 接口,72 小时快速完成物流系统集成。全流程实战1V1指导,营造开放的API技术生态圈。

更多推荐