建设网站商城,做网站收益,行业网站建设多少钱,长沙产品设计公司本次实验准备了三个节点#xff0c;分别为laert-01~03 目录1.安装Alertmanager2.配置启动文件3.验证集群4.关于集群的配置项1.安装Alertmanager
这部分内容在三个节点上都要执行
下载安装包#xff0c;将安装包解压至/data目录下
wget https://github.com/prometheus/aler…本次实验准备了三个节点分别为laert-01~03 目录1.安装Alertmanager2.配置启动文件3.验证集群4.关于集群的配置项1.安装Alertmanager
这部分内容在三个节点上都要执行
下载安装包将安装包解压至/data目录下
wget https://github.com/prometheus/alertmanager/releases/download/v0.25.0/alertmanager-0.25.0.linux-amd64.tar.gz
mkdir /data
tar -xf alertmanager-0.25.0.linux-amd64.tar.gz -C /data
ln -s /data/alertmanager-0.25.0.linux-amd64/ /data/alertmanager2.配置启动文件 alert-01配置 vi /usr/lib/systemd/system/alertmanager.service [Unit]
DescriptionPrometheus Alertmanager Service daemon
Afternetwork.target[Service]
Typesimple
Userroot
Grouproot
ExecStart/data/alertmanager/alertmanager\--config.file/data/alertmanager/alertmanager.yml\--storage.path/data/alertmanager/data/\--data.retention120h\--web.external-urlhttp://192.168.10.3:9093\--web.listen-address:9093 \--cluster.listen-address192.168.10.3:9094Restarton-failure[Install]
WantedBymulti-user.targetsystemctl daemon-reload
systemctl start alertmanager.service
systemctl enable alertmanager.service
systemctl status alertmanager.service alert-02配置 vi /usr/lib/systemd/system/alertmanager.service [Unit]
DescriptionPrometheus Alertmanager Service daemon
Afternetwork.target[Service]
Typesimple
Userroot
Grouproot
ExecStart/data/alertmanager/alertmanager\--config.file/data/alertmanager/alertmanager.yml\--storage.path/data/alertmanager/data/\--data.retention120h\--web.external-urlhttp://192.168.10.4:9093\--web.listen-address:9093 \--cluster.listen-address192.168.10.4:9094 \--cluster.peer192.168.10.3:9094Restarton-failure[Install]
WantedBymulti-user.targetsystemctl daemon-reload
systemctl start alertmanager.service
systemctl enable alertmanager.service
systemctl status alertmanager.service alert-03配置 vi /usr/lib/systemd/system/alertmanager.service[Unit]
DescriptionPrometheus Alertmanager Service daemon
Afternetwork.target[Service]
Typesimple
Userroot
Grouproot
ExecStart/data/alertmanager/alertmanager\--config.file/data/alertmanager/alertmanager.yml\--storage.path/data/alertmanager/data/\--data.retention120h\--web.external-urlhttp://192.168.10.5:9093\--web.listen-address:9093 \--cluster.listen-address192.168.10.5:9094 \--cluster.peer192.168.10.3:9094Restarton-failure[Install]
WantedBymulti-user.targetsystemctl daemon-reload
systemctl start alertmanager.service
systemctl enable alertmanager.service
systemctl status alertmanager.service 3.验证集群
集群任意节点IP通过浏览器访问查看集群状态 当某节点挂了还由其他节点可使用
4.关于集群的配置项
# 当前实例集群服务监听地址为空则禁用高可用功能
--cluster.listen-address0.0.0.0:9094
# 表示集群节点对其他节点发布的地址其他节点可以用这个地址与该地址通信
--cluster.advertise-addressCLUSTER.ADVERTISE-ADDRESS
# 用来设置该 Alertmanager 节点的集群对等体将告警数据同步其他节点
--cluster.peerCLUSTER.PEER
# 对等超时时间默认15秒
--cluster.peer-timeout15s
# 集群消息传播时间默认200ms
--cluster.gossip-interval200ms
# 定义了多个 Alertmanager 实例之间的信息同步频率
--cluster.pushpull-interval10ms
# 评估通知之前等待集群连接建立的最长时间
--cluster.tcp-timeout10s
# 在标记节点不正常之前等待确认的时间
--cluster.probe-timeout500ms
# 随机节点探测之间的间隔
--cluster.probe-interval1s
# 用来设置集群状态稳定的超时时间的参数
--cluster.settle-timeout10ms
# 尝试重新连接到丢失的对等设备之间的间隔时间
--cluster.reconnect-interval10s
# 尝试重新连接到丢失的对等设备的间隔时间
--cluster.reconnect-timeout6h0m0s
# 用于在 Alertmanager 集群模式中配置 TLS 证书
--cluster.tls-config
# 允许节点发送不加密的广播请求从而允许其他节点发现它的地址。
# 这条最好不用
--cluster.allow-insecure-public-advertise-address-discovery