check*padハードウェア障害

check*padに関する重大なお知らせによると、check*padがハードウェア障害で使えなくなっている模様。
その経緯を読んで、いろいろ考えてみた。

現在までのおおまかな経緯は以下のとおりです。

  • 2008-01-15 午前4時ごろ、サーバーが停止。サーバーの再起動をかけて復帰。
  • 2008-01-16 午前4時ごろ、サーバーが再度停止。再起動をかけるが、HDDに障害が発生していることが判明。ディスクチェックをかけて復帰。データベースのバックアップ処理にかかるが、HDD障害のため失敗。負荷の少ない時間帯にて何度か試みるも失敗。
  • 2008-01-17 データベースのバックアップ処理の対策を講じる。代替サーバーの準備。
  • 2008-01-18 データベースのバックアップを再度試みるが失敗。HDD故障によりサーバー停止。HDDのハードウェア交換と同時にデータバックアップをサーバー会社に依頼。同時に代替サーバーにcheck*padのプログラムおよび、1月14日時点でのデータを移行、テスト予定。
check*padに関する重大なお知らせ

私が管理人なら、HDDに障害が発生していることがわかった時点でサービスを停止するかな。ハードはいくらでも替えがきくけど、データが逝ったらどうにもならない。サーバがどういった構成になっているのかわからないから何ともいえないけど、HDDに障害が発生した状態で運用した上に障害対応するなんて出来るようにしていないと思うし。
何にせよ、利用している人も多いと思いますし、なるべく早く復旧して欲しいところですね。