新手做网站做那个,韶关哪里做网站最好,wordpress图片拖拽到富文本里面,沈阳网站改版作者#xff1a;仲阳
这是云的时代#xff0c;现在云计算已经在各行各业广泛的应用。但是上云对于大多数客户来说#xff0c;依然有很大的学习成本#xff0c;如下图仅是阿里云都有几百款产品#xff0c;怎么选择#xff1f;怎么用#xff1f;对于客户来说都是问题。“…作者仲阳
这是云的时代现在云计算已经在各行各业广泛的应用。但是上云对于大多数客户来说依然有很大的学习成本如下图仅是阿里云都有几百款产品怎么选择怎么用对于客户来说都是问题。“用好云、管好云”不仅仅是口号还是我们的目标。 来自于https://developer.aliyun.com/ebook/8326?spma2c6h.26392470.ebook-read.3.1c186341TEtt9B《阿里云产品手册 2024 版》
“兵马未动、粮草先行” 今天我们就针对阿里云的上云新用户如何开启自己的可观测历程做一个简单的介绍。
认识可观测的分层 在可观测的领域里面技术栈主要分为 metric、trace、log 三个方向从业务分成上我们的观点主要分为体验、业务、应用和资源。这个金字塔越上面的越贴近用户的真实体感比如用户用了 100 台服务器其中一台服务器宕机不一定能影响用户但如果是从网络监控上发现问题大概率用户已经受影响。反过来讲金字塔越下面发现的问题越具体、越能快速解决还是上面这个例子ECS 有问题可以重启、扩容等处理方式但用户体验服务不可用的原因就有很多需要更多时间去确定问题。
言归正传今天我们希望跟一些刚刚涉猎阿里云的客户可以快速构建一套完整的云资源监控解决方案。在此基础上随着云应用的深入有更多可观测解决方案等着你。
阿里云云监控的初体验
阿里云云监控旨在解决可观测领域的各种问题。基石就是下面这三个技术栈在这个基础上又分为 Dashboard、Alert、API 等多用应用方式。云监控云服务监控主要针对的是 Metrics on Cloud Resource 这个场景。 首先我们要先进入云监控产品页可以看到有五大功能模块——云资源监控、网络分析与监控、可视化 Dashboard、告警服务、事件中心。其中云资源监控是我们今天重点分享的一个功能模块这个模式是开箱即用的功能只要用户在阿里云上购买了资源产品就可以在这里看到相关的监控指标大盘。 既然要“用好云”自然是要按照“看得见”、“听得见”。需要时可以通过可视化组件看到云资源的状态忙时系统还会自动的监控资源通过报警系统通知出来。 在云监控上如何“看得见”
无用质疑ECS 是阿里云计算的根基也是云监控首要支持的一个款产品。在云监控的菜单体系里面也是最显眼的地方如上图。用户购买 ECS自然可以在“主机监控”这个菜单看得到。主机监控的视图将围绕 CPU、内存、负载、网络、磁盘同时也提供了 Top 5 进程监控。 云监控不仅仅有 ECS 的监控有超过 100 款云产品的监控数据都在云监控产品可以说在云监控可以看到阿里云资源的任意监控。 高阶玩家还有两个选择
1自定义 Dashboard可以用自己的视角管理云资源监控。
2通过 API 将监控指标数据拉走通过自建的监控系统做集成。
这篇文章主要聚焦在监控运维的第一步高阶玩法暂时不展开。
如何在云监控系统中“听得见”
做过运维的人都应该清楚一个事情可观测是手段不是目的。客户最重要的目的是让自己的应用服务长期保持高可用。为了这个目标可观测是第一步首先要看得见系统的状态然后就是在这个状态不正常进行合理的运维比如扩容、重启、迁移、限流等等。
同样高阶玩家有很多措施可以完成这个目标“应用服务长期保持高可用”但在这篇文章中我们更想给初入此道的同学以简单易用类似于 helloworld 这个层次的介绍。有了第一步进阶还远么
如何听得见
电话、短信、邮件不够
钉钉、企业微信、飞书好像有点意思了
自动弹性伸缩ESSServiceless 函数调度FC消息队列驱动运维MSN还可以这样
终极杀器——WebhookPagerduty、Slack、Teams。
如果上面这些措施客户还听不见没事你提出来谁知道未来是怎样的。
其中这里面暗含另一个问题我们需要听见什么声音报警阈值的规则高阶玩家可以选择智能阈值、组合报警、表达式报警等重量级别的功能。那初阶玩家应该做什么两个事情一键报警和治理检测。
一键报警云监控已经将最重要的指标以及指标的合理阈值都总结出来对于初阶用户来说不用太多思考先将报警规则设置好当云资源出现问题时就可以及时响应。 治理检测如果你不清楚你在云监控的用法是否合理不用费脑子一键诊断按照提示下一步即可。一下子可以达到“水准之上”的水平。 写在后面
云资源监控是可观测领域里面一个子集监控是运维的驱动力。可观测的建设是长期的包括体验层面的 RUM前端监控、synthetic拨测、PTS压测应用监控APM日志等多方位全面的覆盖。大家需要根据自己的业务重要程度来做相应的解决方案。
今天只是初步的介绍了最入门的几个云监控开箱即用的能力最小依赖的可以在阿里云得到基本的监控报警保证。后面还有有一系列的文章介绍云监控的概念和能力。
参考资料
[1] “CITE 2015”亮点解读《2015 政府工作报告》
https://www.cac.gov.cn/2015-04/09/c_1114917386.htm
[2] 阿里云产品手册 2024 版
https://developer.aliyun.com/ebook/8326?spma2c6h.26392470.ebook-read.3.1c186341TEtt9B
[3] 阿里云云监控帮助文档
https://help.aliyun.com/zh/cms/
[4] 云监控指标
https://help.aliyun.com/zh/cms/support/appendix-1-metrics?spma2c4g.11174283.0.0.2f30182fLPRKyv
[5] AWS cloudwatch
https://aws.amazon.com/cn/cloudwatch/
[6] 钉钉
https://oa.dingtalk.com/
[7] 企业微信
https://work.weixin.qq.com
[8] 飞书
https://www.feishu.cn/
[9] pagerduty
https://www.pagerduty.com
[10] slack
https://slack.com/intl/zh-cn/
[11] teams
https://www.microsoft.com/zh-cn/microsoft-teams/group-chat-software