TSUBAME3.0計算サービスのWebページはこちら

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

【障害報告】2015.7.2発生:/work1 ストレージ障害

(グループディスクを利用している方向けの情報です)

                             学術国際情報センター
平成27年7月2日

 下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

 日時:7月2日(木) 12:10 から 15:15 頃

 影響: /work1 のごく一部にアクセスできない。

 詳細:

 12:10にディスクのあるRAIDセットの一つ(Pool#30)が2台のディスク障害により冗長性のない状態(No Redundant)となりました。その結果、データ保護のためこのRAIDセットが自動で読み取り専用となり、work1を構成する104個あるOSTのうちの一つの「OST1b」に対する書き込みができない状態となりました。

 その後14:45よりメンテナンスを行い、15:15に復旧しました。メンテナンス期間中、「OST1b」への読み書きができませんでした。「OST1b」以外のOSTに対するread/writeは可能ですが、‘df’や’ls -l’など「OST1b」にアクセスするコマンドを実行するとプロンプトが返ってこなくなる状態でした。

用語説明

  OST:Lustreファイルシステムにおいて、ファイルの中身を実際に保存しているディスクの集合体