このページの更新は終了しました。

最新の情報はTSUBAME3.0計算サービスのWebページをご覧ください。

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

【障害報告】2017.3.24発生:U/Vキュー管理サーバ停止

(バッチキューを利用している方向けの情報です)

                             学術国際情報センター
2017年3月29日

 下記の通りバッチキューに障害が発生し、復旧いたしました。

 日時:3月24日(金) 2:01から8:19頃

 影響: U/Vキューの管理サーバの動作停止

 詳細:

2:01頃U/Vキューを管理するt2zpbs-vm1のPBSデーモンの応答がなくなり、

・t2sub コマンドで U/V キューへのジョブ投入が出来ない
・U/V キューの Q (待ち状態) のジョブが R (実行中) 状態に遷移しない
・Cloud Utilization、t2statコマンドによるU/Vキューのジョブ実行状況の確認ができない

状態が発生しました。8:19頃リスタートを実施し復旧しました。