TSUBAME3.0計算サービスのWebページはこちら

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

/wrok1, /gscr0 メンテナンスについて(11/24実施)

(バッチキューを利用している全ての方向けの情報です)

学術国際情報センター
平成27年11月17日

 11月14日(土)に発生した/work1, /gscr0障害によるサービスの縮退を復旧させるため、11月24日(火)の10:00から11:00に/work1, /gscr0の一部のメンテナンスを行います。作業中、対象箇所のI/Oが遅延や切断が発生する可能性がありますのでご注意ください。

期間:

11月24日(火)の10:00から11:00

詳細:

8台あるOSSの中の1台t2s007045サーバに通常接続されている14台のOST(gscr0_OST04の1台、work1_OST34〜40の13台[16進表記])の接続が障害によりフェイルオーバー先であるt2s007047に移動し負荷が集中しています。これをテイクバックにより元の状態に戻します。作業時間中、これらのOSTへのアクセスが一時的に遅延したり、切断が発生する可能性があります。

用語説明:

OSS:Lustreファイルシステムにおいて、計算ノードに対してファイルの中身を実際に送受信するサーバ。/work1, /gscr0は8台のOSSで構成される。

OST:Lustreファイルシステムにおいて、ファイルの中身を実際に保存しているディスクの集合体。/work1, /gscr0は112台のOSTで構成され、1OSSあたり14のOSTが接続される。