深入解析:用 lsof 揪出“幽灵文件”释放磁盘空间

日常运维中,你是否遇到过这样的情况:明明已经删除了大文件,但磁盘空间却迟迟未释放?du 显示没问题,df 却提示磁盘快满?这背后可能隐藏着一种“幽灵文件”现象。本文将带你深入了解问题根源,并借助 lsof 工具快速定位并解决这类疑难问题。

什么是“幽灵文件”?

“幽灵文件”(又叫 deleted but open files)是指已经被从文件系统中删除,但依然被某些进程打开着的文件。它们不再出现在目录结构中,但因为被进程持有,它们的空间不会被释放。

📌 举个例子:你运行了一个程序,它在写一个日志文件 audit.log。某天你为了节省空间直接删除了 audit.log,但这个程序并没有关闭文件句柄,导致这部分空间仍然被占用。

复制
[root@s-zb-dba02 mnt]# lsof +L1 | grep deleted auditd 6134 root 4w REG 253,0155446270995536 /var/log/audit/audit.log (deleted) .....1.2.3.
问题表现

使用 df -h 看到根目录快满:

复制
[root@s-zb-dba02 mnt]# df -h 文件系统 容量 已用 可用 已用% 挂载点 devtmpfs 252G 0 252G 0% /dev tmpfs 252G 771M 252G 1% /dev/shm tmpfs 252G 14G 239G 6% /run tmpfs 252G 0 252G 0% /sys/fs/cgroup /dev/mapper/rhel-root 42G 41G 1.2G 98% / ....1.2.3.4.5.6.7.8.

而 du -sh /* 却发现加起来没这么多空间:

复制
du-sh /* 8G /var 1G /home ... 总计加起来远远小于 42G1.2.3.4.5.

这就说明:有空间被“非文件系统中的文件”占用了,也就是“幽灵文件”!

lsof 是什么?

lsof(List Open Files)是 Linux 系统的核心诊断工具,它能列出所有进程打开的文件资源。在 Linux哲学中"一切皆文件"的背景下,lsof 可查看的不仅是常规文件,还包括:

网络套接字(TCP/UDP)管道(PIPE)和 FIFO共享内存设备文件被删除但仍被进程占用的文件

基础用法速查:

复制
# 查看指定进程打开的文件 $ lsof-p<PID> # 查看指定用户打开的文件 $ lsof-u<username> # 查看指定目录下被打开的文件 $ lsof +D /path/to/dir # 查看指定文件系统的打开文件(推荐排查磁盘空间问题) $ lsof +aL1 <mount-point>1.2.3.4.5.6.7.8.9.10.11.

关键参数解析:

+a:AND条件组合+L1:仅显示链接数小于1的文件(即被删除的文件)+aL1:组合条件查找已删除但被占用的文件如何用 lsof 揪出“幽灵文件”?

你只需要一条命令,就能找到这些占用磁盘空间的“幽灵文件”:

复制
lsof +L1 |grep deleted1.

示例输出:

复制
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NLINK NODE NAME auditd 6134 root 4w REG 253,0155446270995536 /var/log/audit/audit.log (deleted) tuned 7696 root 3w REG 253,054912034451806 /var/log/tuned/tuned.log (deleted) rsyslogd 7700 root 5w REG 253,0391297111920101454061 /var/log/messages-20250310 (deleted) rsyslogd 7700 root 6w REG 253,0391297111920101454061 /var/log/messages-20250310 (deleted) rsyslogd 7700 root 7w REG 253,0391297111920101454061 /var/log/messages-20250310 (deleted) rsyslogd 7700 root 8w REG 253,0391297111920101454061 /var/log/messages-20250310 (deleted)1.2.3.4.5.6.7.

字段解释:

COMMAND:哪个进程PID:进程 IDFILE:文件类型(txt、mem、del等)SIZE:文件大小NAME:文件路径(显示 deleted)如何解决?

(1) 方法一:重启进程(推荐)

找到对应的 PID,使用如下命令结束它:

复制
kill-912341.

或者优雅重启进程(推荐):

复制
systemctl restart auditd1.

注意:重启服务前请确保不影响业务运行!

(2) 方法二:使用 truncate 清空文件

若不能重启,可以通过 proc 文件系统,清空该文件句柄:

复制
truncate -s0 /proc/6134/fd/41.

其中 6134 是 PID,4 是对应的文件描述符,可在 lsof 结果中找到。

预防措施程序中使用日志轮转(logrotate)+ 信号通知关闭旧句柄。日志定期清理时,建议使用 truncate 而不是 rm。定期巡检系统中被删除但仍然打开的文件:
复制
lsof|grep deleted1.
小结

“幽灵文件”虽不常见,但一旦出现就很容易造成磁盘空间莫名减少。掌握 lsof,不仅能迅速定位问题,更能为你节省大量排查时间。

记住:删除不等于释放,进程还在引用,就还占空间!

阅读剩余
THE END