vmware虚拟化误操作是如何进行恢复的呢?
现在随着虚拟化技术的成熟,很多企业也在运用虚拟化技术。虚拟化技术的原理是将硬件虚拟化给不同的虚拟机使用。简单的说也就是一台物理的机器上可以有多台虚拟机,但如果就物理机器出现故障或者存储服务器出现故障都会导致上层的虚拟机不可用,还有包括人为误操作等原因,这些都会导致虚拟机里面的重要数据丢失。今天北亚小编要为大家分享的是关于vmware虚拟化误操作的数据恢复案例。
【环境描述】
1)故障虚拟机是由物理机迁移到EXSI上面的,迁移完成后以防不稳定做了一个快照。
2)虚拟机上运行的是一个SQL 2005的数据库,记录了从2008年到2014年所有的数据。
3)整个EXSI上一共有20几台虚拟机,EXSI连接的存储是一台HP EVA4400,所有的虚拟机(包括故障虚拟机)都放在EVA上。
【故障描述】
由于员工的误操作,不小心还原快照了。快照是3年前做完迁移时建的,也就是虚拟机还原到3年前了。也就意味着这3年的数据都被删除了,而这些数据都是特别重要的。
【准备工作】
还原快照就相当于删除数据,也就意味着底层的存储空间会被释放一部分。为了不让这部分空间重用,需要将连接这台存储的所有虚拟机都关掉,如果有重要的虚拟机不能长时间宕机,则需要迁移到别的EXSI上。而客户这里有一台虚拟机很重要,不能关机,只能做热迁移。而vmware的热迁移则是需要建立N多个快照来完成迁移的,这给后期的恢复快照工作带来很多麻烦。迁移完所有虚拟机后就需要对底层的EVA存储做镜像了,但是客户比较着急,镜像整个存储需要的时间太长。最后将EVA存储以只读的方式挂载到一台服务器上,我们以只读的方式恢复数据。
【解决方案】
Vmfs文件系统介绍:
Vmware自己的文件系统叫做Vmfs,所有的虚拟机都存放在这个文件系统中。Vmfs文件系统中默认会将整个磁盘分成1M的Block,分配给文件的最小单位为一个Block。Vmfs文件系统中会有一片区域描述这些1M Block的使用情况,而每1024个Block(也就是1GB)会用一个MAP来记录。这个MAP里面记录的1M Block在物理磁盘上不一定是连续的。但这个MAP所记录的所有1M Block一定是同一个文件的。可以理解为一个文件是由N多个MAP中的1024个Block组成的,即FileSize = N * MAP * 1024(Block)。
Vmware的快照其实就是一个文件,还原快照也就意味着是删掉一个文件。而在Vmfs文件系统中,删除一个文件只会删掉文件的索引项,而不会删掉文件的实际数据以及指向数据的MAP。而我们要做的就是提取整个vmfs文件系统中空闲的MAP,然后在空闲的MAP中找到一个符合快照文件头结构的MAP。然后根据快照文件的结构,提取快照文件剩下的碎片。提取完快照文件后,需要将快照文件和原vmdk合并生成新的vmdk。新的vmdk中包涵了所有的数据,接下来挂载新的vmdk解释里面的数据即可。
【数据恢复成功】
由于客户做过热迁移虚拟机,所以导致快照有几个碎片被重用了。最终恢复的数据中,最新的数据不可用。但由于客户的数据是数据库,并每天都备份2次,最新的数据不可用,但备份的数据可用,虽然数据有部分不能用但也挽救了大部分数据,
如何减少或避免服务器故障?
1. 定期检修、维护。服务器硬件的性能受使用寿命的影响,定期对设备进行检修和维护可以及时发现可能出现故障的各类情况。例如硬盘读写缓慢、异响、阵列中硬盘掉线等都是即将出现故障的前兆。
2. 定制服务器应急计划。可定制一套应急计划,例如备份服务器,应急电源,冗余内存等,在服务器停止运行时可以立即启用应急计划,避免影响业务。
3. 定期更新软件。可以定期对服务器内的操作系统、软件进行更新,做好安全防护,避免病毒攻击。
4. 建立事件日志。对操作者和操作内容进行严格监控,尽可能实现自动化。