Yes, I'm really enjoying everything!

smilemark blog

Computer & Network 自宅サーバ日記

RAIDでも安心できない

投稿日:

今回のクラッシュまでの様子。

12月1日午前1時39分
RAIDからPort 0異常のメールが届く。
12月1日午前1時40分
mrtgがHDDの温度が測定できなくなったエラーのメールが届く。
12月1日午前3時53分
/var/log/messagesがここで終わっている。そこまでに特に問題は見当たらない。
12月1日午前4時02分
いつもどおりLogWatchのメールが届く。内容に異常はない。

ログにはこれまで特にHDDの障害を示すようなものはなかったと思う。SMARTもこれまでウォッチしていなかった。見ていれば何か兆候をつかめたかもしれない。
腑に落ちないのは、Port 0のHDDの故障は良いとしても、なぜ残りのHDDのデータがクラッシュに陥ったのか。原因も何も分からないので、復旧したものの安心はできない。
RAIDはHDDの故障には有効だが、データクラッシュにはどうしようもない。これはバックアップあるのみだ。痛感。
これまでのHDDトラブルの履歴メモ。

2003年12月
RAIDカードAdaptec 1210SAと160GB HDD(Maxtor 6Y160MO)2基でRAIDを開始。
2004年5月
Adaptec 1210SAのドライバをバージョンアップするとデータがクラッシュした。RAIDをやめてATA1基での運用に戻す。
2005年4月
RADIカード3ware 8006-2LPを導入。ついでに静音HDDケースも導入。
2005年6月
RAIDがエラー。1基読めなくなるが、静音HDDケースから出して温度を下げてリビルドするとリカバリした。HDDのクーリングに気を使う必要を感じる。
2005年12月
RAIDからHDD1基がエラーと通知。しかし残りのHDDもデータがクラッシュしていてfsckでもリカバリできなかった。
これまでのHDDには不安がるので新品に交換。

今のところRAIDで得したことはほとんどない。怖い目にあってばかりのような気がする。orz
今回HDDを別のブランドのものに交換したが、実働は約1年だった。故障やクラッシュの原因はもしかするとHDDの側に原因があるのかもしれない。自宅でのサーバ運用は夏場もたいしたクーリングもされずに使われる。使っていたMaxtorのHDDは発熱量も結構あったので、かなり酷だったと思う。

-Computer & Network, 自宅サーバ日記

Copyright© smilemark blog , 2024 All Rights Reserved Powered by STINGER.