懒猫微服商店里的 Console 配置集群监控 Webhook 通知指南

忘机山人

发布于327天前
博客图片修整中,看不了可以先搜索公众号“忘机山人”看。
在集群管理中,监控关键指标如CPU、内存、磁盘、JVM等是至关重要的。对于Easysearch及ES生态系统,还需要关注集群本身的指标,例如搜索延迟、集群状态、节点移除等。INFINI Console不仅提供了默认的监控指标,还支持用户自定义监控项。当监控数值达到预设阈值时,系统可以通过Webhook发送通知至Slack、飞书等平台。



https://appstore.lazycat.cloud/#/shop/detail/xu.infinilabs.console


## 监控配置流程

### 1. 告警对象与通知渠道设置

在INFINI Console中,首先需要配置监控对象和通知渠道:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/6940579b-3d5a-4273-9291-80e19f7aee9e.png "image.png")


### 2. 告警中心管理

通过告警中心可以集中管理所有监控告警:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/e7accc62-7db2-4318-8963-78f53a89436a.png "image.png")

### 3. 告警详情查看

每个告警事件都提供详细信息查看功能:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/99933ba4-5b23-4808-a99b-b1d4be5e19a7.png "image.png")

### 4. 告警历史记录

系统完整记录所有历史告警信息:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/aedada2e-ba0a-48db-a9f1-572f08f5df34.png "image.png")

## Webhook实现示例

以下是用Python实现的Webhook接收服务:

```python
from flask import Flask, request, jsonify
import json
from pprint import pprint

app = Flask(__name__)

@app.route('/webhook', methods=['POST'])
def webhook():
    # 获取并处理请求数据
    raw_data = request.data
    decoded_data = raw_data.decode('utf-8')
    data = json.loads(decoded_data)
    
    # 打印接收到的数据
    print("Received data:")
    pprint(data)
    
    # 返回响应
    return jsonify({
        "status": "success",
        "message": "Webhook received"
    }), 200

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=8000)
```

## Webhook配置步骤

1. 在Console中添加Webhook配置:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/53d4b594-b1bf-4e9c-b4bd-962ec9cdcf17.png "image.png")

2. 查看捕获的告警信息:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/ca8ff846-d31e-45d2-beda-40a318b4b9c7.png "image.png")

## 飞书Webhook集成

### 1. 创建飞书群组

在飞书客户端创建新的群组:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/e8060162-20cf-4b38-84cf-c432fd005e1c.png "image.png")
### 2. 添加自定义机器人

选择添加自定义机器人:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/a97bc085-604c-4508-99f8-30c0f9fa3755.png "image.png")

### 3. 配置机器人信息

设置机器人名称和描述:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/54220dfc-0522-408b-a67d-9540d99b3ec9.png "image.png")

### 4. 获取Webhook URL

完成配置后获取Webhook地址:


![image.png](https://dl.playground.lazycat.cloud/guidelines/459/febb0f5a-951a-476c-9e03-080344d9203c.png "image.png")
通过以上配置,即可实现集群监控告警的实时通知,确保系统运维人员能够及时响应各种异常情况。

评论

0

暂无评论

说点什么呢~
收藏
0
0
0