本鱼拟成立工作室承接项目开发/软件定制/云设施开发运维/办公设备技术支持等,如您有相关需求,欢迎来询 | ::博客文章推荐::

哪个年轻人没有挂过几个磁盘阵列

: 杂七杂八 木魚 15℃ 0评论

01. 毁灭吧磁盘阵列

凌晨四点多才睡的觉。

睡的时候寝食难安,因为磁盘阵列寄了,5tb的数据灰飞烟灭。

寝食难安倒不一定是这些数据多有价值,而是,这一次的灰飞烟灭太过于轻松,以至于我很难接受这样的现实。

1.1 磁盘寄了

时间要说回到一周前,我突然发现用来挂载在一台机器上的九块机械磁盘中的一块无法访问内容了,访问会报IO错误。

因为机器是24×7运行的,开始的时候我觉得这可能是偶发性问题,于是便重启了一下机器。

结果机器重启后这块硬盘的分区无法挂载,提示找不到分区。lsblk看了一下,发现这块盘确实是没有任何分区了。

然后一个不太妙的现象是,这块硬盘虽然能识别,但是识别出来的容量是0,也就是磁盘容量不见了。

到这里我还有点轻视这个小家伙,觉得是不是硬盘分区表之类的错误导致的。因为之前有过意外断电导致分区表损坏分区丢失之类的事情发生。于是我关机,把这块硬盘摘下来挂到硬盘盒里。

上电的瞬间我有点恍惚,经典的希捷硬盘敲盘此刻有了具象化的感受。

我不允许有人没听过敲盘的声音。

听到磁头敲盘两次后停转,这磁头机械故障实锤了。

这是一块希捷的ST2000DM001硬盘,购置于2016年,已经第九个年头,出问题似乎……也不是那么意外。

开盘换磁头啥的很贵,我就不去想了,毕竟本身这块硬盘也没什么重要的数据。我从数据库里查了一下,看看这块盘里放的是什么。看了一下,哦,还好,就只放了一部韩剧,“请回答1988”。

1.2 反思

这件事促使我开始反思数据安全性,毕竟我所有的磁盘容量加起来超过100TB,我永远无法保证下一块损坏的磁盘里是没有重要数据的。而这块磁盘的损坏告诉了我,哪怕是机械硬盘,只要物理损坏也是有可能一无所有的。

于是我开始琢磨是不是应该组件RAID阵列。

硬件阵列是不用想了,不想花钱,我也花不起了现在。于是我把目光转向了软件阵列。

花了一周时间测试了一下Linux下组件RAID5阵列。这阵列允许坏一块磁盘,我想了想,同时坏两块磁盘的概率应该不会……那么点背吧。要是同时坏两块盘那么所有数据灰飞烟灭,这会不会比只丢那一块盘的数据风险更高?这是个问题,我以前也是这么担心的所以一直没组阵列。你要是搞其它阵列比如RAID6或RAID1或RAID10……我这小本经营的,也烧不起那个冗余。

测下来感觉还可以,除了扩容和新建的时候同步速度比较慢以外,稳定性倒是还行,没有因为意外断电、意外重启、强制关机等关系导致进度和数据丢失。

于是在用三块闲置的2TB盘测试几天后,决定先把这些老的2TB硬盘组成阵列,因为它们都是旧硬盘,我得为随时退休做好准备。

在花了一天一夜终于同步好3到4块盘后,开始朝阵列里捯饬数据,累积捯饬进去接近5TB数据后,又腾出来3块2TB的硬盘。

1.3 啪得一下,很快啊,数据就厶了

3块盘就绪后,我将文件系统卸载然后关机,重新组织了一下硬盘数据线和相关供电,然后重新上电。

熟练地按照演练的开始扩容。

mdadm -a /dev/md0 /dev/sdj /dev/sdm /dev/sdk

mdadm -G /dev/md0 -n 7

操作完后,系统状态显示开始同步。

然后呢,插头突然松了,这台主机突然异常关机。

你也别问我怎么会就这么巧,我哪里知道,反正很突然就对了。

再次开机后,这个阵列就不见了。

状态显示为 inactive,看了下状态,发现磁盘只认到上次同步的四块,新加的三块没有出现,因为磁盘数量不够因此阵列无法启动。

然后呢,这三块盘其实是在线的,就在那水灵灵地躺着,但mdadm不认,说上面没有raid的superblock。

我都服了……想了想可能是文件系统缓存的锅,太突然所以缓存没来得及写入硬盘。

都快24小时了,做了很多尝试,还是没能恢复阵列的重组,还搁那躺着呢。我觉得数据绝大部分应该还是在那四块盘里的,毕竟resync刚开始,但……专业限制,没干过运维的活,实在不知道这种情况下应该如何重组阵列,也不敢贸然尝试导致更大的错误。

俗话说得好,隔行如隔山,运维和开发又不一样,这甜蜜的太让人受挫了。

这可能是年轻人的第一次阵列崩溃吧。

看看有没有哪个懂行的专家能拯救下我这只迷途的年轻人……

如果有哪个专家的好心人能提点一下的话,我愿捐出昨天从美团抢的……几杯奶茶。

02. 精神病吧

我忘记什么时候了,具体啥时候,反正是最近的事儿,说,这个是病。

我买完快递后,拆下来的纸箱,除非是萎了或者破了,我都会习惯性地收集起来。

大的是觉得可以拿来收纳装东西,或者以后搬家、

小的时候觉得要卖点啥二手的玩意儿可以用来包装。

反正横竖都有用就对了。

直到有一天看到个视频,说喜欢收集纸箱这些是不是精神病。

然后那个医生搁那酷酷一顿分析,说这个确实是精神病。

我说呢,怎么感觉自从开始收集纸箱之后整个人精神了很多。

03. 人生具象化了罢

我买了个硬盘盒,从深圳发货。

然后这个硬盘盒从深圳千里迢迢地抵达魔都后,并没有停留住它放浪不羁的步伐。

正当疑惑着为什么到魔都都一天多了还没派件这是干啥呢,突然收到通知说它已经抵达辽宁。

又隔了一天后,它终于从辽宁启程再次前往魔都。

我就这样看着它的轨迹,此刻与它共情。

这快递的轨迹,像极了我的人生。

也许正确答案早在不知道什么时候就路过过,只是没有停留而已。

04. 到底是谁啊这么喜欢

这年头也不知道为什么,是个东西就喜欢搞预售。

你付款了,还得等它十天半个月的,才会发货。

没东西你就老实点不要卖,为什么让人等,谁知道爱情和意外哪个会先来啊?

你们不要把自己的供应链风险转嫁给消费者好不好,我厌恶极了等待。

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址