与#告警#相关的内容第2页 - PmDaddy

全部分类数据库前端云计算

[转帖]限制内核 udp bad checksum 失败告警信息

问题描述某系统 dmesg 信息中有如下内容频繁打印，冲掉了其它相关的信息，需要限制打印。 UDP: bad checksum. From 10.66.245.93:61525 to 255.255.255.255:137 ulen 58 相关代码内核源码树中的文件名： net/ipv4/udp

[转帖]Redis连接未释放，造成TCP连接数过多

https://segmentfault.com/a/1190000022704886 早上看到服务器告警通知，TCP连接数比较高，达到5000多，我设置的阈值是5000，正常TCP连接不会这么高，这样的一个阈值我可以提前知道有问题早点解决，不至于后面引起一系列问题，甚至拖垮服务器。排查登陆服务

[转帖]grafana9 使用消息模板配置发送企业微信（wecom）

一、grafana9告警设置： 1、进入告警消息模板介面 2、grafana 消息模板设置 template name : API_msg_tpl #名字随便 {{ define "myalert" }} **警报时间:** {{ .StartsAt.Format "2006-01-02 15:04

[转帖]一次ORA-3136的处理

https://oracleblog.org/working-case/deal-with-ora3136/ 最近收到一个告警，用户说数据库无法连接，但是从监控上看，oracle的后台进程已经侦听进程还是在的，没有任何的alert。登录数据库，已经恢复正常，但是在数据库的alertlog中发现大量

Grafana 系列文章（十三）：如何用 Loki 收集查看 Kubernetes Events

前情提要 IoT 边缘集群基于 Kubernetes Events 的告警通知实现 IoT 边缘集群基于 Kubernetes Events 的告警通知实现（二）：进一步配置概述在分析 K8S 集群问题时，Kubernetes Events 是超级有用的。 Kubernetes Events 可

破局主键重复问题的坎坷路

在这个燥热的夏天，又突然收到告警，分库分表的主键冲突了，这还能忍？不，坚决不能忍，必须解决掉！后面咱们慢慢道来是如何破局的，如何走了一条坎坷路……

dmesg 时间误差现象

案例现象这天收到监控平台发来的告警，说有台机器程序崩溃了因为以前也有过相关的错误，根据经验，用 dmesg命令看下内核信息发现有点不对劲，报错信息的时间跟告警时间不一致，正常来讲报错时间应该跟告警时间一致使用 date 命令查看一下当前系统时间然后我们查看一下系统日志由上面的输出可以看到

[转帖]记一次靠谱的 K8S 排错实战过程，硬核！

http://blog.itpub.net/31545813/viewspace-2925035/ 一背景收到测试环境集群告警，登陆 K8s 集群进行排查。二故障定位 2.1 查看 Pod 查看 kube-system node2 节点 calico pod 异常。查看详细信息，查看nod

[转帖]记一次靠谱的 K8S 排错实战过程，硬核！

http://blog.itpub.net/31545813/viewspace-2925035/ 一背景收到测试环境集群告警，登陆 K8s 集群进行排查。二故障定位 2.1 查看 Pod 查看 kube-system node2 节点 calico pod 异常。查看详细信息，查看nod

[转帖]vCenter使用 VMCA 续订证书：续订证书时发生意外错误

https://www.dinghui.org/vcenter-sts-certificate.html 起因：有一处客户vCenter告警：STS签名证书即将过期。处理办法：系统管理-证书-证书管理，选择STS证书，操作，使用vCenter证书刷新；强制刷新，即可。提示重启，重启后，STS证

真·Redis缓存优化—97%的优化率你见过嘛？

本文通过一封618前的R2M(公司内部缓存组件，可以认为等同于Redis)告警，由浅入深的分析了该告警的直接原因与根本原因，并根据原因提出相应的解决方法，希望能够给大家在排查类似问题时提供相应的思路。

服务器神秘挂起：一场惊心动魄的内核探案

2024年6月17日，我们的运维团队突然收到了一连串的告警。监控大屏上，代表着不同 Sealos 可用区的绿点中，零星地闪烁起了一两个红点。 “奇怪，怎么有几台服务器突然 hang 住了？” 值班的小辉皱起了眉头。这次故障的诡异之处在于它的随机性。并非所有节点都受到影响，而是在不同可用区中，时不时

零代码零硬件玩转华为云IoT，基于设备联动实时监控设备

本文分享自华为云社区《一键守护，实时洞察：华为云IoT设备联动，智能感知设备状态变化，精准触发告警通知【零代码零硬件玩转华为云IoT】》，作者：周周的奇妙编程。前言在前面我们已经体验过了设备接入、设备控制和数据长效存储三个方面的内容。（踏云而行：五步带你运用设备模拟器接入华为云IoT物联网平台，

ESXi查看底层存储磁盘厂商型号的方式与方法

ESXi查看底层存储磁盘厂商型号的方式与方法背景公司一台过保的服务器出现了磁盘告警 Vendor不太靠谱. 过保的机器就不管了不买他们的服务器也不说一下是啥硬盘. 想自己替换,需要先获取磁盘的型号. 云中心的人担心出问题不敢拔硬盘直接看我这边骨折了又去不了现场. 只能想办法进行解决. IPM

[转帖]什么是pagecache/dentries/inodes?

https://ixyzero.com/blog/archives/3233.html =Start= 缘由：最近因为新上了一个扫描功能导致大范围内的机器告警，新上的功能代码其实非常简单： find / -type f -name "ffmpeg" -executable 2>/dev/null

[转帖]Redis集群实例内存使用率飙升排查

在一个阳光明媚的下午，突然生产环境有一个缓存实例发出内存使用率超过90%的告警，然后立刻和小伙伴们一起看是什么情况。现象是这样的，集群里的一个实例的内存使用率超过了90%，而这个实例的从节点，内存使用率却很低。而且其他分片的内存使用率都很低，只有这个分片高。见下图cachecloud实例状态图。

[转帖]07-rsync企业真实项目备份案例实战（需求收集--服务器配置---客户端配置---报警机制---数据校验---邮件告警）

https://developer.aliyun.com/article/885820?spm=a2c6h.24874632.expert-profile.279.7c46cfe9h5DxWK 简介： 2.需求描述客户端需求： 1.客户端每天凌晨1点在服务器本地打包备份（系统配置文件、日志文件、其

使用Prometheus监控docker compose方式部署的ES

需求收集 ES 的指标, 并进行展示和告警; 现状 ES 通过 docker compose 安装所在环境的 K8S 集群有 Prometheus 和 AlertManager 及 Grafana 方案复用现有的监控体系, 通过: Prometheus 监控 ES. 具体实现为: 采集端 el

如何使用 Blackbox Exporter 监控 URL?

如何在 Kubernetes 中使用 Blackbox Exporter 与 Prometheus 进行 URL 监控采集、展示和告警。

使用Prometheus监控docker compose方式部署的ES

需求收集 ES 的指标, 并进行展示和告警; 现状 ES 通过 docker compose 安装所在环境的 K8S 集群有 Prometheus 和 AlertManager 及 Grafana 方案复用现有的监控体系, 通过: Prometheus 监控 ES. 具体实现为: 采集端 el

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化