矛盾:RAID 是增加了麻烦还是增加了安全?
但是想起来前段时间批评过编辑们用一些很怪异很吸引人的标题来咋呼,不甘心与他们一起堕落,于是,换成这个比较贴切的标题(矛盾:RAID 是增加了麻烦还是增加了安全?)。
可能这样的标题看起来不够那么吸引人,也不够醒目,但是符合INTERNET上的惯例,看到标题就大概知道内容,包括这段文字也应该是描述正文的:
[separator]
前几天刚处理完自己硬盘的故障,一早还没起床就接到电话。因为没睡醒,没好气的说“留下号码,等我一会打过去!”几分钟后才意识到这个电话的重要性,不是随便谁都能在这个时候打这个号码找我的。于是点了根烟,一边努力的让脑子清醒一点,一边把电话打过去。
“磁盘阵列……数据库……重要……恢复……”
当这么几个词出现在脑子里的事情,一切就都变的如此简单,一边安排初试的信息收集,一边答复尽快赶到现场。
几分钟后就确定了行程安排:
- 30分钟后做好所有准备赶去车站,买票;
- 搭乘70分钟后的火车赶去60KM外的现场;
- 路上大概有60分钟时间做准备工作,考虑解决方案;
冲咖啡、洗脸、刷牙、换衣服、梳头、喝咖啡用去5分钟,然后坐下抽烟。为了不慌张,能想清楚要做什么和怎么做。
15分钟后,着手准备随身的物品、笔记本、活动硬盘、光盘和一罐水,当然还有一定不能离身的烟斗 ^_^……
30分钟后,已经把车票揣进口袋,一边享受着久违的阳光,一边思考如何安排解决方案。
- 最好的情况是要按原样恢复磁盘阵列,让系统恢复运行
- 其次要把重要的数据库找回来
- 再次要把上次的备份找回来
- 最差也要把阵列重建,通过其他方式恢复备份
11:10到达了现场,一边喝水一边抽烟,不想让现场人员的紧张影响到自己,一个想法坚定在心中“哪怕什么都不做,也不能莽撞操作,让情况变的更糟糕。等一下,再等一下!”
13:00
问题原因:清理系统日志后,系统无法启动。反复安装系统不成功。
硬件情况:IBM 服务器,1块独立出来做系统,另外4块硬盘做RAID5。
当前状况:RAID盘上已经被重新分区并安装了SERVER2003。
狂晕,要在重新分区并安装过系统的RAID盘上找数据回来。心中暗自叫苦,一个几乎是”不可能的任务“;一边还要让整整36小时没睡觉的兄弟们不要失去信心:“我会尽力的”
截止到现在,还在用EasyRecovery查找可能有用的数据,进度显示还要1小时32分结束扫描。
假如能够把数据库的上次备份找回来就是很好的运气。一边喝咖啡一边向自己祈祷,
- 千万冷静
- 不能莽撞
- 一定要做可逆的操作。
问题一:RAID的系统真的安全吗?
假如是普通硬盘,出现这种硬盘故障的几率是否同样高?至少摘下来挂到别的机器上可以轻松恢复吧?不需要我一边拿移动硬盘装EasyRecovery(尽可能少占用RAID盘空间,正确多找回来点数据),一边还要映射网络驱动器保存找回来的数据。
即便,也要这么麻烦的操作,那么我用RAID起什么作用了?不是同样需要用工具软件逐个扇区去找逐个文件去恢复?
问题二:RAID系统真的方便吗?
我亲手配置过的RAID5有十几台,就只在测试的时候,尝试过把配好的系统换上一块空硬盘,让它自己在那里嘎嘎吱吱的用好几个小时的时间去恢复。平时都没遇到过派上RAID用场的地方。倒是遇见过坏了一块盘什么数据都找不回来的麻烦。假如是普通的IDE盘倒简单了,随便找台计算机挂上,想怎么找怎么找,也不用坐机房去忍受让人达哆嗦的空调和刺耳的噪音。
至少,在我所经历的网管生涯中,RAID除了在报计划的时候让决策者认为“系统配置相当稳定”之外,我自己始终没觉得和不做RAID有明显的好处。
- RAID 0 把几个盘当一个使,提高磁盘读写速度吗?坏一个所有数据全完蛋
- RAID 1 把几个盘折一半使,一个数据错误,所有盘上都是错误数据。
- RAID 5 确实是最好的选择,测试时候确实是坏一块盘换一块盘能自己恢复,但是实际工作中,没遇到坏盘数据就已经完蛋了。
或者,做RAID是增加了安全的同时,增加了点麻烦。
不过,我更相信,RAID只是增加了麻烦,提高了门槛,是阻止非专业人员随便接触服务器的最佳理由:“什么都不懂,别随便动!”
毕竟,少了自以为是、自作聪明的那些“动手比动脑快“的人的捣鼓,服务器确实工作起来要“安全”的多。
大概,RAID的安全,就是这样“提高”的吧。








