维护笔记:一次生产环境 Linux 文件系统损坏的修复记录

今天分享一个Linux文件系统损坏的恢复案例。

一、现象

值班人员突然收到服务器宕机的紧急告警通知,然后告知我。尝试通过堡垒机进入服务器查看状态,结果无法进入,服务器应该是掉线了。

接着我通过云平台登录到后台界面,看到下面的界面:

然后我输入密码尝试回车,出现下面的界面:

从报错可以判断:文件系统坏了。而且涉及两个分区:/dev/vda5和/dev/vdb1,其中vda5是系统盘。

二、修复过程

说明一下:操作系统是CentOS7.6 ,分区格式是ext4。

1. 进入单用户模式

后台重启服务器,开机启动时出现下图界面时,按e键:

在后面输入: init=/bin/sh,并按 ctrl x  执行:

2. 手动执行 fsck

进入单用户模式后,使用 lsblk 确认分区挂载情况后,先对/dev/vda5系统盘进行修复:

复制
fsck -y /dev/sda51.

幸运的是,系统能自动修复这些问题,数据损失极少。

接着就是通过同样的命令修复/dev/vdb1:

复制
fsck -y /dev/vdb11.

-y参数是确认所有修复项,如果不添加则会逐项确认。

【温馨提示】如果是xfs文件系统使用xfs_repair修复:

复制
# xfs 不支持 fsck xfs_repair /dev/sdX1.2.
3. 重启并验证服务

退出单用户模式重新启用:

复制
exec /sbin/init1.

最后,顺利登录到操作系统。进入系统需要检查数据完整性,业务都顺利启动,还好数据没有丢失。

三、注意事项

定期备份是救命稻草,修复有风险,需要先做快照强烈建议关键分区独立挂载出问题就写笔记,下次就不慌

系统故障不可怕,可怕的是不知道怎么应对。一次次实践、总结和反思,是运维工程师不断成长的关键。

阅读剩余
THE END