基于电商项目的应用运维管理AOM实操
基于电商项目的应用运维管理AOM实操
1 概述
1.1 背景介绍
应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
1.2 适用对象
- 企业
- 个人开发者
- 高校学生
1.3 案例时间
本次案例总时长预计60分钟。
1.4 案例流程
{{{width="65%" height="auto"}}}
说明:
① 用户购买弹性云服务器ECS,并将服务部署上去; ② ECS虚拟机上安装ICAgent采集用户虚拟机指标数据上传至AOM服务; ③ 应用运维管理服务AOM采集指标数据并通过可视化图标形式展现给用户; ④ 应用运维管理服务AOM配置指标监控,产生告警后通过消息通知服务SMN服务通知到用户邮箱。
1.5 资源总览
本次案例预计花费总计1.0元。
| 资源名称 | 规格 | 单价(元) | 时长(h) |
|---|---|---|---|
| 弹性云服务器ECS | X86计算,通用计算增强型 | c7.large.2 | 2 vCPUs | 4 GiB CentOS 7.6 64bit (40GB) | 0.6 | 1 |
| 应用运维管理AOM | 按需计费 1百万次 | 0.9元/天 | 1 |
| 消息通知服务SMN | 电子邮件方式 1000封以下免费 | 2元/1000封 | 1 |
| CodeArts服务 | 免费体验版 | 免费 | 1 |
2 资源接入AOM并配置可视化图表
2.1 前置条件
请参考“基于云主机的CodeArts IDE运行Java电商项目”确保在ECS虚拟机上已部署了自己的电商项目应用,并且可以正常运行以及产出日志。
2.2 使用AOM对资源进行接入管理
登录华为云首页,在搜索框中输入“应用运维管理 AOM”,查询出应用运维管理服务AOM,点击“控制台”按钮,跳转到应用运维管理服务首页。

如果进入的是下图AOM1.0版本,请点击左下侧的“体验新版”跳转到新版AOM服务。

进入AOM服务页面后,点击左下的“设置”。 
点击“菜单开关”,将“概览”开关按钮打开。 
返回,点击“概览”。

在AOM概览首页,点击“应用视角->创建应用”。

进入应用资源管理页面,点击右上角的“创建应用”。

根据提示填写应用信息,确认。

然后点击“点击接入组件”按钮。

填入组件名称,确认。

点击“接入环境”按钮。

根据提示填写环境信息,确认。

点击“关联资源”按钮。

选择自己待接入的ECS虚拟机,然后点击“关联资源&安装Agent”按钮。

如果机器没有安装UniAgent,需要点击“手动安装”进行手动安装。

点击“复制”图标进行命令复制。

跳转到弹性云服务器ECS服务首页,点击我们部署应用的虚拟机的“远程登录”按钮。

弹出框滑到最下面,选择VNC方式登录,

使用root账户登录,然后输入密码,登录到虚拟机。
输入:
cd /opt
回车,跳转到opt目录下,输入:
mkdir AOM
回车,创建APM文件夹,输入:
cd AOM
回车,进入AOM文件夹,然后输入刚刚复制的UniAgent安装命令,回车。

出现以上日志即完成了资源的接入与UniAgent的安装。 
2.3 服务器上安装ICAgent
ICAgent是指标采集工具,使用AOM服务采集主机的指标数据时,需要安装ICAgent。
ICAgent的安装步骤具体可参考“云日志服务 LTS”服务的安装步骤提示。
在云日志服务首页,点击左侧菜单栏中的“主机管理”,然后点击下拉菜单中的“主机”跳转到日志接入页面。

在主机页面点击右上角的“ICAgent”按钮,查看ICAgent安装步骤。 
本实验主要以Linux虚拟机安装ICAgent来做演示。

2.3.1 步骤一 获取AK和SK
参考如何获取AK和SK来获取AK/SK。
2.3.2 步骤二 复制ICAgent命令
复制服务自动生成的ICAgent命令,注意要根据提示将其中的 {input_your_ak} 和 {input_your_sk}替换成步骤一中获取的AK/SK。
2.3.3 步骤三 执行安装ICAgent命令
登录我们部署服务的ECS机器上,然后输入步骤二复制的ICAgent命令,回车执行。显示如下图表示ICAgent安装成功。

2.4 查看资源指标
在应用运维管理服务首页,点击“监控中心”,跳转到监控中心页面。

点击“指标浏览”,Prometheus实例选择“Prometheus_AOM_Default”指标(AOM采集的基本指标都存放在Prometheus_AOM_Default中),比如我们想查看虚拟机的CPU使用情况,就选择“aom_node_cpu_usage”,筛选条件选择“主机名称”,然后选择自己的虚拟机,即可在控制台页面上查看到虚拟机的CPU使用率情况。

2.5 指标可视化图标创建
点击“仪表盘 -> 创建仪表盘”。

根据提示填写仪表盘信息,然后确认。 
点击右上角的“添加图标”图标按钮(或者下面的添加图表按钮),进行图表添加。

填入图表标题,以创建CPU指标图表为例,选择折线图,指标选择“aom_node_cpu_suage”,条件选择“主机名称”,然后选择自己的虚拟机,点击“保存”,

即完成了指标图表化的创建。

3 配置告警
自动化运维服务 (Automation) 作为AOM的自动化运维平台,依托华为云UniAgent运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。
3.1 消息通知配置与订阅
在华为云首页的搜索框中输入“消息通知服务 SMN”,点击“控制台”,登录到消息通知服务SMN首页。

点击“主题”,进入主题列表详情页面。

点击右上角的“创建主题”按钮,进行主题创建。

填写主题的基本信息。

主题创建完后,点击主题后面的“添加订阅”按钮。

协议选择邮箱,终端中填写自己的邮箱即可。

登录自己输入的邮箱,确认消息订阅。

订阅成功。 
3.2 指标告警配置
在AOM的指标页点击“告警管理->告警行动规则”,然后点击“创建告警行动规则”按钮进行告警行动规则的创建,基本信息按需求填写,需要注意的是“行动规则类型”选择“指标或事件”,行动方式选择“通知”,主题选择3.1创建的主题,消息模板点击超链接进行创建。

消息模板创建参考下图:

告警行动规则创建完毕后,点击“告警管理->告警规则”,点击“创建”按钮进行告警规则的创建。
自定义填写规则名称和企业项目,本案例中告警规则设置选择“指标告警规则”,配置方式选择“全量指标”,Prometheuse实例选择“Prometheuse_AOM_Default”。

告警规则详细选择“多指标”,指标信息与2.4相同,配置我们需要监听的虚拟机的CPU,为了测试我们选择CPU使用率大于1%即触发告警。

告警设置中,告警通知场景选择“告警触发时”和“告警恢复时”,告警方式选择“直接告警”,通知频率选择“只告警一次”,行动规则选择之前创建好的规则。

点击“立即创建”,即完成告警规则的创建。

3.3 查看指标异常告警


以及告警邮件信息。
至此,基于电商项目的应用运维管理AOM实操全部结束。
更多推荐

所有评论(0)