与#告诉#相关的内容第6页 - PmDaddy

全部分类数据库前端云计算

一次OOM事故的学习过程

事故过程周二下午得到消息, 希望帮忙分析dump文件. 告知dump大小为42G大小. 一般机器没这么大的内存进行处理. 建议现场上传到百度云盘, 然后我这边进行下载. 时间进度为: 11.57创建的dump 现场打包压缩, 拉取上传百度云盘. 速度大概只有500KB/S. 压缩后文件6G, 时间

[转帖]Prometheus + Spring Boot 应用监控

https://blog.51cto.com/u_15127622/2757942 1. Prometheus是什么Prometheus是一个具有活跃生态系统的开源系统监控和告警工具包。一言以蔽之，它是一套开源监控解决方案。Prometheus主要特性：多维数据模型，其中包含由指标名称和键/值对标识

[转帖]Linux 网络栈原理、监控与调优：前言（2022）

http://arthurchiao.art/blog/linux-net-stack-zh/ Published at 2022-07-02 | Last Update 2022-07-02 本文尝试从技术研发与工程实践（而非纯理论学习）角度，在原理与实现、监控告警、配置调优三方面介绍内核5.1

[转帖]Linux 网络栈接收数据（RX）：配置调优（2022）

http://arthurchiao.art/blog/linux-net-stack-tuning-rx-zh/ 本文尝试从技术研发与工程实践（而非纯理论学习）角度，在原理与实现、监控告警、配置调优三方面介绍内核5.10 网络栈。由于内容非常多，因此分为了几篇系列文章。原理与实现 Linux

[转帖]MSE注册配置中心和自建注册配置中心对比

https://help.aliyun.com/document_detail/469154.html?spm=a2c4g.11186623.0.0.1a2779a6aPjzic 本文从运维、性能、高可用、监控告警等维度进行分析，介绍MSE注册配置中心和自建注册配置中心的差异。 MSE Nacos和

[转帖]nginx的proxy_next_upstream使用中的一个坑

https://zhuanlan.zhihu.com/p/35803906 今天线上系统出了点问题，机房的电信出口突然不通了，原本以为能自动切换的nginx配置，居然没有生效，导致了业务告警，手工紧急处理了才解决了。当时的设想是，如果这个服务的访问，出现了500或者超时的情况，会自动重试到下一个服

KylinV10升级部分软件的简单方法

背景 2022-12-26有同事晚上在群里反馈客户现场的测试环境内存紧张. 我这边第一反应是进程重复了,导致内存使用量飙升. 告知现场使用 ps -ef |grep java |grep caf 发现只有一个进程. 然后使用 top 然后输入 M 使用内存排序: 发现除了java主服务之后还有 au

[转帖]天融信专用运维管理系统（专用计算平台版）V1.0 服务器客户端

是否国产是基本功能用于专用信息设备运行状态数据的采集、分析和异常状态告警。产品包含管理端软件和客户端程序。主要功能包括：1、资产管理与状态采集：支持将用户网络中所有专用信息设备纳入资产管理，基于专用数据采集协议持续收集分析资产对象的操作系统、处理器、内存、文件系统分区、、磁盘I/O、网络接口的

[转帖]Redis cluster故障复盘，预案、工具、判断一样都不能少！

http://blog.itpub.net/31545813/viewspace-2924677/ 背景最近从ELK日志分析发现：有很多应用连接redis 超时; 监控平台出现”redis 集群不健康“告警; 结合之前的经验，我们一般的应处理手段为：重启连接redis超时的应用，原因有以下两点：

[转帖]优化工作中的取舍和大势判断

最近这段时间在参与一个优化项目，所以思考优化的事情比较多。因此最近的文章中，优化相关的内容会比较多，如果有朋友想看些其他方面的题材，可以留言告知。实际上我每天写的东西大多数都是前一天的思想内容，凭空找个话题来写上一篇，时间长了肯定会越来越空洞无物，我也没有那个本事，脑子里的积累写上几年还游刃有余。关

[转帖]夜莺监控项目

项目介绍夜莺监控是一款开源云原生观测分析工具，采用 All-in-One 的设计理念，集数据采集、可视化、监控告警、数据分析于一体，与云原生生态紧密集成，提供开箱即用的企业级监控分析和告警能力。夜莺于 2020 年 3 月 20 日，在 github 上发布 v1 版本，已累计迭代 100 多个版

[转帖]Alertmanager 部署配置

https://www.cnblogs.com/winstom/p/11940570.html 目录前言源码安装配置启动配置prometheus监控Alertmanager 修改prometheus配置重新加载配置文件配置测试告警修改prometheus配置重新加载配置文件测试触

[转帖]记一次sst文件损坏修复过程

https://tidb.net/blog/54e388c8 【2023-07-14 14:26:28】应用系统报警删除数据失败，查看日志报Region is unavailable，同时企业微信群也收到数据库告警信息。二、问题定位首先查看集群进程都正常，登录tidb dashboard查看日志

ESXi主机报错：其他主机硬件对象的状态（System Management Software 1 SEL Fullness）

ESXi主机报错：其他主机硬件对象的状态（System Management Software 1 SEL Fullness）问题现象一次巡检过程中发现vcenter中有esxi主机告警，如下图。查看监控>>硬件运行状况>>警示和警告，报 System Management Software

Prometheus AlertManager 生产实践-直接根据 to_email label 发 alert 到对应邮箱

概述通过之前的文章 - Prometheus Alertmanager 生产配置趟过的坑总结, 我们已经知道 AlertManager 作为告警平台，是非常强大的，可以去重 (deduplicating)，分组 (grouping)，并将它们路由 (routing) 到正确的接收器 (receiv

一个斜杠引发的CDN资源回源请求量飙升

背景一个安静的晚上，突然接到小伙伴电话线上CDN回源异常，具体表现为请求量飙升，且伴有少量请求404，其中回源请求量飙升已经持续两天但一直未被发现，直到最近404请求触发了告警后分析log才同时发现回源量飙升这一问题。触发问题的原因很快被发现并修复上线，这里分享一下跟进过程中进一步学习到的CDN

一次Python本地cache不当使用导致的内存泄露

## 背景近期一个大版本上线后，Python编写的api主服务使用内存有较明显上升，服务重启后数小时就会触发机器的90%内存占用告警，分析后发现了本地cache不当使用导致的一个内存泄露问题，这里记录一下分析过程。 ## 问题分析 ### LocalCache实现分析该cache大概实现代码如下

预约直播|3月30日下周四，应用促活大揭秘，快速提升DAU

【导读】日常运营过程中，消息推送是App触达用户的常用手段，无论是新功能的通知，还是活动的提醒，都可以通过推送告知用户。千人千面的个性化推送，对于提升用户粘性、用户转化等指标都具有明显正向效果。越来越多的应用选择华为Push用户增长服务作为拉新、促活的首选渠道，他们选择的理由是什么？他们又是如何持

DevOps | 产研协同效能提升之评审、审批流、质量卡点

研发过程中有各种需求的评审、审批流和质量卡点，有的是为了质量把关，有的是为了彰显权力，还有一些是为了信息告知。本文主要讨论在软件开发过程中涉及的评审、审批和质量卡点三种情况，同时探讨对研发流程的影响，在这过程中如何去提效。同团队内部评审同团队之间的评审包括产品团队内部的PRD评审，RD团队内部的

DevOps｜服务治理与服务保障实践指南

朱晋君@君哥聊技术我自己为了消化里边的内容，整理了一个脑图，希望对你有帮助。凌晨四点被公司的监控告警叫醒了，告警的原因是生产环境跑批任务发生故障。即刻起床处理故障，但还是花了不少时间才解决。这次故障是一次数据校验的跑批任务，校验前面跑批任务的数据是否正确。幸运的是，之前的核心任务已经完成，并没

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化