告警策略(工作负载级别)
KubeSphere 支持针对节点和工作负载的告警策略。本教程演示如何为项目中的工作负载创建告警策略。有关如何为节点配置告警策略,请参见告警策略(节点级别)。
准备工作
- 您需要启用 KubeSphere 告警系统。
- 若想接收告警通知,您需要预先配置一个通知渠道。
- 您需要创建一个企业空间、一个项目和一个用户(例如
project-regular
)。该用户必须已邀请至该项目,并具有operator
角色。有关更多信息,请参见创建企业空间、项目、用户和角色。 - 您需要确保项目中存在工作负载。如果项目中没有工作负载,请参见部署并访问 Bookinfo 来创建示例应用。
创建告警策略
-
以
project-regular
身份登录控制台并访问您的项目。导航到监控告警下的告警策略,点击创建。 -
在弹出的对话框中,提供如下基本信息。点击下一步继续。
- 名称:使用简明名称作为其唯一标识符,例如
alert-demo
。 - 别名:帮助您更好地识别告警策略。
- 描述信息:对该告警策略的简要介绍。
- 阈值时间(分钟):告警规则中设置的情形持续时间达到该阈值后,告警策略将变为触发中状态。
- 告警级别:提供的值包括一般告警、重要告警和危险告警,代表告警的严重程度。
- 名称:使用简明名称作为其唯一标识符,例如
-
在规则设置选项卡,您可以使用规则模板或创建自定义规则。若想使用模板,请填写以下字段。
- 资源类型:选择想要监控的资源类型,例如部署、有状态副本集或守护进程集。
- 监控目标:取决于您所选择的资源类型,目标可能有所不同。如果项目中没有工作负载,则无法看到任何监控目标。
- 告警规则:为告警策略定义规则。这些规则基于 Prometheus 表达式,满足条件时将会触发告警。您可以对 CPU、内存等对象进行监控。
备注
您可以在监控指标字段输入表达式(支持自动补全),以使用 PromQL 创建自定义规则。有关更多信息,请参见 Querying Prometheus。点击下一步继续。
-
在消息设置选项卡,输入想要在包含在通知中的告警标题和消息,然后点击创建。
-
告警策略刚创建后将显示为未触发状态;一旦满足规则表达式中的条件,则会首先达到待触发状态;满足告警条件的时间达到阈值时间后,将变为触发中状态。
编辑告警策略
若要在创建后编辑告警策略,点击告警策略页面右侧的 。
-
点击下拉菜单中的编辑,按照创建时相同的步骤来编辑告警策略。点击消息设置页面的确定保存更改。
-
点击下拉菜单中的删除来删除告警策略。
查看告警策略
在告警策略页面,点击任一告警策略来查看其详情,包括告警规则和告警历史。您还可以看到创建告警策略时基于所使用模板的告警规则表达式。
在告警监控下,告警监控图显示一段时间内的实际资源使用情况或使用量。告警消息显示您在通知中设置的自定义消息。
反馈
这篇文章对您有帮助吗?
通过邮件接收 KubeSphere 最新的技术博客与产品更新的通知
感谢您的反馈。如果您有关于如何使用 KubeSphere 的具体问题,请在 Slack 上提问。如果您想报告问题或提出改进建议,请在 GitHub 存储库中打开问题。
页面内容