与#故障诊断#相关的内容第5页 - PmDaddy

全部分类数据库前端云计算

[1036]kvm虚拟机访问时提示no route to host分析

环境宿主机： IP： 10.110.136.43 版本：Kylin Linux Advanced Server release V10 (Sword) KVM vm： IP： 10.110.136.59 版本：UnionTech OS Server 20 故障描述 kvm虚拟机136.59可以被其

[转帖]Linux命令之strace命令

一、命令简介 strace是一个有用的诊断、指导和调试工具。系统管理员、诊断专家和故障解决人员将发现，对于解决源代码不易获得的程序的问题，这是非常宝贵的，因为它们不需要重新编译以跟踪它们。学生、黑客和过分好奇的人会发现，通过跟踪甚至是普通程序，可以了解到大量关于系统及其系统调用的信息。程序员会发现，

[转帖]k8s 污点和容忍

文章目录污点和容忍污点（Taints）查看污点：设置污点删除污点容忍 (toleratints)Pod 设置容忍设置容忍时间容忍示例节点自污染，pod 应对节点故障污点和容忍在 Kubernetes 中，节点亲和性 NodeAffinity 是 Pod 上定义的一种属性，能够使 Pod 按

[转帖]sar命令查看历史数据

https://zhidao.baidu.com/question/336610169339992805.html 2022-06-29 · TA获得超过4965个赞关注前言有的时候，我们要通过对系统的cpu负载等性能数值的查看，来判排查系统产生某种故障(经常死机或者运行速度突然变慢)的原因。但

[转帖]VCSA6.7证书过期后的处置方法

0x00 环境说明一台测试的ESXI主机，元旦之后已然发现证书已过期，具体现象：VCenter无法登录，一直提示输入用户名和密码，ESXI主机web页面无法登录。重启VC以后，报故障503错误。 /Action = Allow Pipname = /var/run/vmware/vpxd-webs

[转帖]技术分享 | 国产麒麟 arm 上编译安装 xtrabackup8

原创发布于 2022-07-19 13:29:29 3220 举报作者：王向爱可生 DBA 团队成员，负责公司 DMP 产品的运维和客户 MySQL 问题的处理。擅长数据库故障处理。对数据库技术和 python 有着浓厚的兴趣。本文来源：原创投稿 *爱可生开源社区出品，原创内容未经授权不得随

[转帖]linux将大目录等分切割成多个小目录

https://www.jianshu.com/p/6f9e6743a1dc 需求：有一个目录存放了数十万个文件，现在需要将这个目录上传，如果整个目录上传，中间因为某些故障断开连接了，可能又要从头开始这时就需要将目录切割成多个小目录，分批次上传，一个简单的 shell 脚本即可实现思路很简单：遍

[转帖]TiKV 多副本丢失以及修复实践

https://tidb.net/blog/ad45bad9#6%E6%80%BB%E7%BB%93 1实验目的随着tidb使用场景的越来越多，接入的业务越来越重要，不由得想试验下tidb组件的高可用性以及故障或者灾难如何恢复，恢复主要涉及的是pd组件和tikv组件，本文主要涉及tikv组件， p

[转帖]linux将大目录等分切割成多个小目录

https://www.jianshu.com/p/6f9e6743a1dc 需求：有一个目录存放了数十万个文件，现在需要将这个目录上传，如果整个目录上传，中间因为某些故障断开连接了，可能又要从头开始这时就需要将目录切割成多个小目录，分批次上传，一个简单的 shell 脚本即可实现思路很简单：遍

[转帖]TiDB损坏多副本之有损恢复处理方法

https://tidb.net/blog/b1ae4ee7 TiDB分布式数据库采用多副本机制，数据副本通过 Multi-Raft 协议同步事务日志，确保数据强一致性且少数副本发生故障时不影响数据的可用性。在三副本情况下，单副本损坏可以说对集群没什么影响，但当遇到多副本损坏的损坏丢失的时候，如何快

问题记录：VMware vSphere vCenter 6.7 虚拟机迁移失败

问题记录：VMware vSphere vCenter 6.7 虚拟机迁移失败环境说明： VC版本：VMware vSphere vCenter 6.7 ESXi版本：VMware vSphere ESXi 6.7 问题现象：迁移虚拟机到别的ESXi主机时报错：vMotion失败。查看信息故障点

「笔记」某移动SRE运维体系交流

痛点传统竖井式IT架构（封闭、隔离、非标、难运维） X86 服务器硬件稳定性不足开源软件可靠性不足，且不可控出了故障，被动救火救不完转型由此催生了转型升级的需求：运维智能（SRE）的转型 SRE运维模式核心职责保证：业务连续性应用连续性平台连续性职责分工综合运维岗 7*24

如何借助Kafka持久化存储K8S事件数据？

大家应该对 Kubernetes Events 并不陌生，特别是当你使用 kubectl describe 命令或 Event API 资源来了解集群中的故障时。 ``` $ kubectl get events 15m Warning FailedCreate replicaset/ml-pipe

19c RAC 告警日志报错 ORA 7445 [pevm_icd_call_common()+225]

问题现象：在一套2节点的19c RAC 环境下，节点2 alert告警 ORA 7445，且频度固定为每分钟报一次；期间有重启实例，但故障依旧： 2023-02-07T12:51:04.359849+08:00 PL/SQL package SYS.DBMS_RCVMAN version 19.1

记录一则ADG备库报错ORA-29771的案例

有客户找到我这边咨询，说他们的一套核心ADG库在业务高峰期报错，因为业务做了读写分离，其备库也实际承担读业务，所以备库故障也会对业务产生影响。这里也要提醒大家，做读写分离，如果读库出现故障的情况，要有切换到主库的应急方案考虑进去。客户这里自己通过重启备库暂时解决，但担心故障再现，所以非常着急要分

DevOps｜服务治理与服务保障实践指南

朱晋君@君哥聊技术我自己为了消化里边的内容，整理了一个脑图，希望对你有帮助。凌晨四点被公司的监控告警叫醒了，告警的原因是生产环境跑批任务发生故障。即刻起床处理故障，但还是花了不少时间才解决。这次故障是一次数据校验的跑批任务，校验前面跑批任务的数据是否正确。幸运的是，之前的核心任务已经完成，并没

JVM 内存大对象监控和优化实践

服务器内存问题是影响应用程序性能和稳定性的重要因素之一，需要及时排查和优化。本文介绍了某核心服务内存问题排查与解决过程。首先在JVM与大对象优化上进行了有效的实践，其次在故障转移与大对象监控上提出了可靠的落地方案。最后，总结了内存优化需要考虑的其他问题。

图数据挖掘：网络中的级联行为

我们现在来研究网络中的传播。事实上，在网络中存在许多从节点到节点级联的行为，就像传染病一样。这在不同领域中都有所体现，比如生物中的传染性疾病；信息技术中的级联故障与信息的传播；社会学中的谣言、新闻、新技术的传播以及虚拟市场。其中在信息技术中信息就会经由媒体来进行扩散（diffusion）。接下来我们看如何基于网络构建传播模型。以传染病为例，传染病会沿着网络的边进行传播。这种传播形成了一个传播树，也

MySQL运维1-日志

一、错误日志错误日志是MySQL中最重要的日志之一，它记录了当MySQL启动和停止时，以及服务器在运行过程中发生的任何严重错误时的相关信息，当数据库出现任何故障导致无法正常使用时，建议首先查看此日志错误日志默认是开启的，默认存在目录/var/log/，默认的日志文件名为mysqld.log, 但

快速掌握keepalived

转载请注明出处： Keepalived是一个基于VRRP（虚拟路由冗余协议）的开源软件，用于在Linux系统上实现高可用性和负载均衡。它的主要功能是通过多台服务器之间的协作，确保在其中一台服务器发生故障时，另一台服务器可以接管其功能，并继续提供服务，从而实现系统的高可用性。常用功能：虚拟IP（V

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化