去る21日の水曜日、Linuxで運用しているサーバで運用していたソフトウェアRAID1構成アレイの1HDDが故障しました。
今回は珍しく、使用中の突然死でした。
故障したHDDは前任のWD製(WD10EADS-00L5B1)が情けなくもたった2年弱で故障したため、シーゲートから我が家に2011年3月に颯爽とデビュー。彼|彼女の名前はST2000DL003。
故障直前までSMART情報も異常がなく、毎週の過酷なRAIDチェックに堪え、6年も連日の酷使に堪えてくれました。
故障第一報は以下でした。
Jun 21 04:20:23 hostname kernel: ata2.00: exception Emask 0x50 SAct 0x60000 SErr 0x4090800 action 0xe frozen突然まったく応答がなくなるという死に方でした。
BIOSからも見えないし、まさしくピンピンコロリ。見習いたい。
長い間どうもありがとう。
死んだHDDは、ペアを組んでいるもう一台のHDD(これもseagateのST31000528AS)が2009年デビューなので、古いほうが死んだらアレイサイズを拡張しようと目論見、元のアレイサイズの倍の製品を購入したのですが、期待むなしく新しいほうが先に故障してしまいました。
余っている領域でTSファイルのエンコードをしていたので(といってもタモリ倶楽部なんですが)、その負荷が祟ったのかもしれませんし、搭載していたPRIMERGY TX1310M1のHDDスロット中で最も温度が高くなる位置に設置していたのも要因かもしれません(死んだHDDの過去一か月の平均温度は36.37度、ピーク時41度でした。相棒の平均温度は27.48度、ピーク時32度ですので確かに故障率が高まります)。
まあ、生き残ったほうもそろそろお迎えが予期されますし、アレイ上のファイルシステムも過去にext2からext3にしたままだったので、この際、アレイの再構築ではなく新HDDで新規に構築し、ファイルシステムもxfsを採用することにし、パーティションテーブルもMBRからGPTに変更して、前世紀から引きついで来たアレイを引退させることにしました。まあ、2TBを超えたらもうGPT一択なんですが。
fdiskも最新版はGPTに対応し始めているのですが、残念ながらまだ実験段階ですので、今回はpartedを使用してパーティションを切ります。
具体的には以下のようにします。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | # parted /dev/sdb GNU Parted 3.1 /dev/sdb を使用 GNU Parted へようこそ! コマンド一覧を見るには 'help' と入力してください。 (parted) mklabel gpt (parted) mkpart パーティションの名前? []? SDB1 ファイルシステムの種類? [ext2]? xfs 開始? 0GB ←開始と終了に単位をつけるのがミソ 終了? 100% (parted) set 1 raid on (parted) p モデル: ATA ST3000DM008-2DM1 (scsi) ディスク /dev/sdb: 3001GB セクタサイズ (論理/物理): 512B/4096B パーティションテーブル: gpt ディスクフラグ: 番号 開始 終了 サイズ ファイルシステム 名前 フラグ 1 1049kB 3001GB 3001GB SDB1 raid |