このページの更新は終了しました。

最新の情報はTSUBAME3.0計算サービスのWebページをご覧ください。

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

【障害報告】2016.11.5発生:Xキュー利用不可

(バッチキューを利用している方向けの情報です)

                             学術国際情報センター
2016年11月9日

 下記の通りバッチキューに障害が発生し、復旧いたしました。

 日時:11月5日(土) 11-05のスロット

 影響: Xキューが作成されず利用できない

 詳細:

11/5 9:00 に11-04のスロットが終了しました。終了時点で予約キューに5,000本以上のジョブが残っていたためジョブの削除が開始されました。9:02にcronにより11-05のXキューの作成処理が始まりましたが、ジョブ削除が間に合わずタイムアウトし、Xキューの作成に失敗しました。その結果11-05のスロットでXキュー(この日は163台)が開始できませんでした。

対策としてタイムアウト値を見直したりリトライ処理したり行うよう改修をする予定です。