ストレージコントローラのメンテナンスにおけるパフォーマンス低下について(7/5,12,19実施)(7/3更新)

(グループディスクを利用している方向けの情報です)

学術国際情報センター
2017年6月30日

【ストレージコントローラのメンテナンスにおけるパフォーマンス低下について】

 workやhome等のTSUBAME2.5のストレージを構成するストレージコントローラのいくつかに不具合があり、部品交換が必要なため下記の通りメンテナンスを行います。ストレージコントローラはActive/Active構成で冗長化されており、サービスを片寄せ(テイクオーバー)しながら作業を行うため基本的に停止しませんが、テイクオーバー時の瞬断(7/5更新:停止が數十分かかることがあるようです)、及び片寄によるパフォーマンスの低下が起こる場合があります。

 (7/3追記) この不具合はストレージコントローラのハードウエアに製造上の問題で、ごく稀に基板が損傷するというもので、この不具合のある機器を利用していても通常は問題はなく、パフォーマンスや正常動作に直ちに影響のあるものではございません。最近頻発している/work1障害とも別の問題です。

1.対象

ホームストレージ(home, apps等), グループディスク(work, data等), 全学ストレージ(nest2)

2.実施日

第1回 7月5日(水) 12:15-17:15
第2回 7月12日(水) 12:15-17:15
第3回 7月19日(水) 12:15-17:15

終了時刻は前後する場合があります。

3.影響

テイクオーバー時の瞬断及び片寄によるパフォーマンスの低下が起こる場合があります。

基本的にサービスは停止しませんがLustre(/work0, /work1, /gscr0)ファイルシステムに既知の未解決の問題によりテイクオーバー時に障害が発生する可能性がございます。
その場合これらの領域にアクセスできなくなる場合があります。

以上