维护笔记:一次生产环境 Linux 文件系统损坏的修复记录
今天分享一个Linux文件系统损坏的恢复案例。
一、现象
值班人员突然收到服务器宕机的紧急告警通知,然后告知我。尝试通过堡垒机进入服务器查看状态,结果无法进入,服务器应该是掉线了。
接着我通过云平台登录到后台界面,看到下面的界面:
然后我输入密码尝试回车,出现下面的界面:
从报错可以判断:文件系统坏了。而且涉及两个分区:/dev/vda5和/dev/vdb1,其中vda5是系统盘。
二、修复过程
说明一下:操作系统是CentOS7.6 ,分区格式是ext4。
1. 进入单用户模式后台重启服务器,开机启动时出现下图界面时,按e键:
在后面输入: init=/bin/sh,并按 ctrl x 执行:
进入单用户模式后,使用 lsblk 确认分区挂载情况后,先对/dev/vda5系统盘进行修复:
复制
fsck -y /dev/sda51.
幸运的是,系统能自动修复这些问题,数据损失极少。
接着就是通过同样的命令修复/dev/vdb1:
复制
fsck -y /dev/vdb11.
-y参数是确认所有修复项,如果不添加则会逐项确认。
【温馨提示】如果是xfs文件系统使用xfs_repair修复:
复制
# xfs 不支持 fsck
xfs_repair /dev/sdX1.2.
退出单用户模式重新启用:
复制
exec /sbin/init1.
最后,顺利登录到操作系统。进入系统需要检查数据完整性,业务都顺利启动,还好数据没有丢失。
三、注意事项
定期备份是救命稻草,修复有风险,需要先做快照强烈建议关键分区独立挂载出问题就写笔记,下次就不慌系统故障不可怕,可怕的是不知道怎么应对。一次次实践、总结和反思,是运维工程师不断成长的关键。
阅读剩余
THE END