kill 进程时遇到的一件有意思的事情

kill,进程,遇到,一件,有意思,事情 · 浏览次数 : 46

小编点评

**案例现象:** 使用 pkill 命令在 CentOS 7 机器上运行一个进程后,发现该进程在 ps 命令中仍然显示,并返回了状态码 1(成功)。然而,当使用 kill 命令尝试杀死该进程时,却成功了。 **问题定位:** 通过 `man pkill` 命令,我们发现 `pkill` 命令默认使用 `pgrep` 命令来查找目标进程。`pgrep` 在从 `/proc/[pid]/stat` 文件中获取进程名称时,默认只获取 15 个字符的进程名称。如果进程名称超出 15 个字符,就会导致 `pkill` 在查找过程中无法找到该进程。 **解决方案:** 为了解决这个问题,我们可以使用 `-f` 参数告诉 `pkill` 不去 `/proc/[pid]/stat` 文件中寻找进程,而是去 `/proc/[pid]/cmdline` 文件里面寻找进程启动的时候的完整命令,包括参数。 **代码示例:** ```bash # 使用 pkill 命令杀死进程 pkill -f after_sleep60s_output # 使用 kill 命令杀死进程 kill -9 after_sleep60s_output ``` **相关 issue 链接:** 1. https://stackoverflow.com/questions/23534263/what-is-the-maximum-allowed-limit-on-the-length-of-a-process-name **总结:** 在使用 `pkill` 命令杀死进程时,如果进程名称超过 15 个字符,`pkill` 会无法找到该进程,导致失败。可以使用 `-f` 参数告诉 `pkill` 不去 `/proc/[pid]/stat` 文件中寻找进程,而是去 `/proc/[pid]/cmdline` 文件里面寻找进程启动的时候的完整命令,包括参数。

正文

案例现象

一般来讲,我们在 kill 掉一个进程的时候通常有两个选择:

  1. 找到进程的 pid 号,然后执行 kill 命令

  2. 找到进程的名字,然后执行 pkill 命令

 

pkill 和 kill 命令都是向指定的进程发送信号,从而完成终结进程的操作,主要区别在于 pkill 命令与 pgrep 配套使用,能够踢出指定终端用户、同时根据 UID 和用户名来终止进程

 

今天给大家分享一件我在使用 pkill 命令时遇到的比较有意思的事情

 

这台机器上(Cent OS7)运行着一个进程 after_sleep60s_output

 

 

执行 pkill 命令

 

 

然后当我使用 ps 命令查看的时候,我发现这个进程还在,而且返回了状态码 1

 

用 kill 命令试试,发现成功了

 

奇怪?为什么用 pkill 命令 kill 不掉这个进程?

 

定位问题

通过 man pkill 我发现,pkill 命令是默认结合 pgrep 来使用的

 

pgrep 首先找出目标进程(running),然后 pkill 再根据 pgrep 的结果来 kill 目标进程

 

 

pgrep 找目标进程是通过获取 /proc/[pid]/stat 文件中的进程名来实现的,但是这个文件中的进程名是有长度限制的——只有15个字符

 

Linux 中的每一个进程都维护了一个 struct_task_struct 结构体,这个结构体在/usr/src/kernels/内核版本/include/linux/sched.h里面

 

这里面有一个字段定义了不包括路径的可执行文件的名字,最大长度是 16 bytes,除去最后一个留给 null 的,就只有最多 15 个字符

 

 

 

然后我们看一下上面例子中进程对应的 stat 文件

 

 

可以看到文件里面的进程名字被截断成了15个字符:after_sleep60s_

 

如果要使用 pkill 命令,正确方式如下:

 

你也可以加一个 -f 参数

 

这个参数会告诉 pkill 不去/proc/[pid]/stat 文件找进程,而是去 /proc/[pid]/cmdline

里面找

 

这个文件里面包含了进程启动的时候的完整命令,包括参数

 

解决问题

想要准确的 kill 掉一个进程,可以使用下面的方法:

  • pidof命令获取到进程对应的 PID,再使用 kill 命令

  • 使用 systemd 启动的,通过 systemctl 命令来控制

  • 使用 pkill 命令的时候建议加上 -f 参数

 

最后附上相关 issue 链接:

1、https://stackoverflow.com/questions/23534263/what-is-the-maximum-allowed-limit-on-the-length-of-a-process-name

与kill 进程时遇到的一件有意思的事情相似的内容:

kill 进程时遇到的一件有意思的事情

案例现象 一般来讲,我们在 kill 掉一个进程的时候通常有两个选择: 找到进程的 pid 号,然后执行 kill 命令 找到进程的名字,然后执行 pkill 命令 pkill 和 kill 命令都是向指定的进程发送信号,从而完成终结进程的操作,主要区别在于 pkill 命令与 pgrep 配套使用

[转帖]linux 上进程被随机kill掉,如何监测和查询;谁杀了我的进程;Who sends a SIGKILL to my process mysteriously on ubuntu server

https://www.cnblogs.com/xuyaowen/p/linux-audit.html 今天跑实验,发现进程被随机kill。咨询了服务器上的其他同学,他们说之前也发生过,一直存在。看来可能有可能不是我自己程序的原因,只能自己动手解决了。 在 Who sends a SIGKILL t

[转帖]kill及kill -9的用法及如何实现进程的优雅退出

1. kill与signals 我们这里所说的kill是指作为shell command的那个kill(相对地,linux 系统中还有个叫做kill的system call, man 2 kill可查看其功能及用法),shell终端中输入man kill可以看到,kill的作用是向某个指定的进程或进

[转帖]kill 参数表

https://www.cnblogs.com/alix-1988/p/14331898.html kill命令格式:kill -Signal pidpid是进程号,可以用 ps 命令查出 signal是发送给进程的信号, 默认参数下,kill 发送SIGTERM(15)信号给进程,告诉进程,你需要

[转帖]Linux kill & Java shutdownhook

https://www.jianshu.com/p/8001a66d37c9 shutdown-hook 建议加上shutdown的钩子 如果程序出现了内存溢出crash 则现在代码是没有任何保护措施的 或者说运维不小心关闭了服务器等 或者运维不小心kill了游戏服务器进程等 无法避免kill -9

常用命令

ps -aux //完整的显示当前用户的所有进程 ps -ef|grep <进程名> //查看并筛选 跟进程名有关的进程,该进程名可以是进程的全部或者部分。 kill -9 98456 //关闭进程 rm -rf /root/logs/game 删除文件夹 rm -f /root/logs/game

[转帖]nginx中用到的kill命令

1、kill命令 1.1、kill命令简介 我们都知道,想要在Linux中终止一个进程有两种方式,如果是前台进程可以使用Ctrl+C键进行终止;如果是后台进程,那么需要使用kill命令来终止。(其实Ctrl+C也是kill命令)。 kill命令的格式是: kill -signal pid 其中 pi

[转帖]某游戏海外版本堆外内存泄露排查

https://www.jianshu.com/p/cae00d9c99fe 某游戏海外版本堆外内存泄露排查 现象 线上有部分服务器用top发现Java进程内存占用占比达到99,而且出现了有一个服务器被Linux OOM Kill 排查 选择了110服,该机器的Java进程最大堆内存设置的是9710

[转帖]如何kill一条TCP连接?

https://www.cnblogs.com/codelogs/p/16838850.html 简介# 如果你的程序写得有毛病,打开了很多TCP连接,但一直没有关闭,即常见的连接泄露场景,你可能想要在排查问题的过程中,先临时kill一波泄露的连接。又比如你要验证程序在遇到网络错误时的自愈能力,想手

[转帖] 如何kill一条TCP连接?

https://www.cnblogs.com/codelogs/p/16838850.html 原创:扣钉日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。 简介# 如果你的程序写得有毛病,打开了很多TCP连接,但一直没有关闭,即常见的连接泄露场景,你可能想要在排查问题的过程中,