与#告警信息#相关的内容第2页 - PmDaddy

全部分类数据库前端云计算

IoT 边缘集群基于 Kubernetes Events 的告警通知实现

背景边缘集群（基于树莓派 + K3S) 需要实现基本的告警功能。边缘集群限制 CPU/内存/存储资源紧张，无法支撑至少需要 2GB 以上内存和大量存储的基于 Prometheus 的完整监控体系方案（即使是基于 Prometheus Agent, 也无法支撑）（需要避免额外的存储和计算资源

IoT 边缘集群基于 Kubernetes Events 的告警通知实现（二）：进一步配置

上一篇文章 IoT 边缘集群基于 Kubernetes Events 的告警通知实现目标告警恢复通知 - 经过评估无法实现原因: 告警和恢复是单独完全不相关的事件, 告警是 Warning 级别, 恢复是 Normal 级别, 要开启恢复, 就会导致所有 Normal Events 都会被发送

“喜提”一个P2级故障—CMSGC太频繁，你知道这是什么鬼？

前段时间收到线上一些列告警，内容是CMSGC太频繁。那接下来这篇文章我会告诉你：什么是CMSGC太频繁；整个排查过程与你分享；以及一些规避手段。

为什么文件删除了但磁盘空间没有释放？

案例现象这天，监控系统发来一条告警消息，内容说某台服务器根目录磁盘占用空间达到阈值，超过百分之八十了登上服务器，df -Th 看一下，发现磁盘空间确实不够用了进入到根目录，然后 du -sh * 可以看到，var 目录下的磁盘空间已经占用了 75G 既然如此，删除 var 目录下一些占空间较大

[转帖]Redis连接未释放，造成TCP连接数过多

https://segmentfault.com/a/1190000022704886 早上看到服务器告警通知，TCP连接数比较高，达到5000多，我设置的阈值是5000，正常TCP连接不会这么高，这样的一个阈值我可以提前知道有问题早点解决，不至于后面引起一系列问题，甚至拖垮服务器。排查登陆服务

[转帖]grafana9 使用消息模板配置发送企业微信（wecom）

一、grafana9告警设置： 1、进入告警消息模板介面 2、grafana 消息模板设置 template name : API_msg_tpl #名字随便 {{ define "myalert" }} **警报时间:** {{ .StartsAt.Format "2006-01-02 15:04

[转帖]一次ORA-3136的处理

https://oracleblog.org/working-case/deal-with-ora3136/ 最近收到一个告警，用户说数据库无法连接，但是从监控上看，oracle的后台进程已经侦听进程还是在的，没有任何的alert。登录数据库，已经恢复正常，但是在数据库的alertlog中发现大量

Grafana 系列文章（十三）：如何用 Loki 收集查看 Kubernetes Events

前情提要 IoT 边缘集群基于 Kubernetes Events 的告警通知实现 IoT 边缘集群基于 Kubernetes Events 的告警通知实现（二）：进一步配置概述在分析 K8S 集群问题时，Kubernetes Events 是超级有用的。 Kubernetes Events 可

破局主键重复问题的坎坷路

在这个燥热的夏天，又突然收到告警，分库分表的主键冲突了，这还能忍？不，坚决不能忍，必须解决掉！后面咱们慢慢道来是如何破局的，如何走了一条坎坷路……

dmesg 时间误差现象

案例现象这天收到监控平台发来的告警，说有台机器程序崩溃了因为以前也有过相关的错误，根据经验，用 dmesg命令看下内核信息发现有点不对劲，报错信息的时间跟告警时间不一致，正常来讲报错时间应该跟告警时间一致使用 date 命令查看一下当前系统时间然后我们查看一下系统日志由上面的输出可以看到

[转帖]记一次靠谱的 K8S 排错实战过程，硬核！

http://blog.itpub.net/31545813/viewspace-2925035/ 一背景收到测试环境集群告警，登陆 K8s 集群进行排查。二故障定位 2.1 查看 Pod 查看 kube-system node2 节点 calico pod 异常。查看详细信息，查看nod

[转帖]记一次靠谱的 K8S 排错实战过程，硬核！

http://blog.itpub.net/31545813/viewspace-2925035/ 一背景收到测试环境集群告警，登陆 K8s 集群进行排查。二故障定位 2.1 查看 Pod 查看 kube-system node2 节点 calico pod 异常。查看详细信息，查看nod

[转帖]vCenter使用 VMCA 续订证书：续订证书时发生意外错误

https://www.dinghui.org/vcenter-sts-certificate.html 起因：有一处客户vCenter告警：STS签名证书即将过期。处理办法：系统管理-证书-证书管理，选择STS证书，操作，使用vCenter证书刷新；强制刷新，即可。提示重启，重启后，STS证

真·Redis缓存优化—97%的优化率你见过嘛？

本文通过一封618前的R2M(公司内部缓存组件，可以认为等同于Redis)告警，由浅入深的分析了该告警的直接原因与根本原因，并根据原因提出相应的解决方法，希望能够给大家在排查类似问题时提供相应的思路。

服务器神秘挂起：一场惊心动魄的内核探案

2024年6月17日，我们的运维团队突然收到了一连串的告警。监控大屏上，代表着不同 Sealos 可用区的绿点中，零星地闪烁起了一两个红点。 “奇怪，怎么有几台服务器突然 hang 住了？” 值班的小辉皱起了眉头。这次故障的诡异之处在于它的随机性。并非所有节点都受到影响，而是在不同可用区中，时不时

零代码零硬件玩转华为云IoT，基于设备联动实时监控设备

本文分享自华为云社区《一键守护，实时洞察：华为云IoT设备联动，智能感知设备状态变化，精准触发告警通知【零代码零硬件玩转华为云IoT】》，作者：周周的奇妙编程。前言在前面我们已经体验过了设备接入、设备控制和数据长效存储三个方面的内容。（踏云而行：五步带你运用设备模拟器接入华为云IoT物联网平台，

ESXi查看底层存储磁盘厂商型号的方式与方法

ESXi查看底层存储磁盘厂商型号的方式与方法背景公司一台过保的服务器出现了磁盘告警 Vendor不太靠谱. 过保的机器就不管了不买他们的服务器也不说一下是啥硬盘. 想自己替换,需要先获取磁盘的型号. 云中心的人担心出问题不敢拔硬盘直接看我这边骨折了又去不了现场. 只能想办法进行解决. IPM

[转帖]什么是pagecache/dentries/inodes?

https://ixyzero.com/blog/archives/3233.html =Start= 缘由：最近因为新上了一个扫描功能导致大范围内的机器告警，新上的功能代码其实非常简单： find / -type f -name "ffmpeg" -executable 2>/dev/null

[转帖]Redis集群实例内存使用率飙升排查

在一个阳光明媚的下午，突然生产环境有一个缓存实例发出内存使用率超过90%的告警，然后立刻和小伙伴们一起看是什么情况。现象是这样的，集群里的一个实例的内存使用率超过了90%，而这个实例的从节点，内存使用率却很低。而且其他分片的内存使用率都很低，只有这个分片高。见下图cachecloud实例状态图。

[转帖]07-rsync企业真实项目备份案例实战（需求收集--服务器配置---客户端配置---报警机制---数据校验---邮件告警）

https://developer.aliyun.com/article/885820?spm=a2c6h.24874632.expert-profile.279.7c46cfe9h5DxWK 简介： 2.需求描述客户端需求： 1.客户端每天凌晨1点在服务器本地打包备份（系统配置文件、日志文件、其

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化