The current TSUBAME operational status

The current TSUBAME operational status:/work1 failure. -> Recovered.


年度末のTSUBAMEの停止について

2017年度より/data0の運用が変更になります。

投入したジョブが実行されない場合の確認手順

TSUBAMEの既知の問題一覧はこちら


過去に発生した個別の障害はこちら

システムの主な自動チェック項目はこちら


 

  • Network 

 

キャンパスネットワーク(Titanet3)の障害・メンテナンス情報はこちらで御確認下さい。

 

過去の情報はこちら

 

Login(Interactive Nodes, I/O node) 

2017.3.27 17:00 unavailable because of "年度末メンテナンス、TSUBAME3.0導入工事に伴うTSUBAMEの停止について(2017春)"

 

 Information of the past

 

 

 

Batch queue

2017.3.27 17:00 unavailable because of "年度末メンテナンス、TSUBAME3.0導入工事に伴うTSUBAMEの停止について(2017春)"

 

現在の各キューの稼動状況はこちらジョブを効率よく実行したい場合こちら。ノード台数は故障等により常に増減します。

Information of the past

  

Storage   HPCI共用ストレージはこちら

2017.3.27 17:00 unavailable because of "年度末メンテナンス、TSUBAME3.0導入工事に伴うTSUBAMEの停止について(2017春)".

 

new 2017.3.21 17:35 /work1 is recovered.

new 2017.3.21 13:15 /work1 cannot be accessed from interactive nodes.

 

グループディスクに書き込めない場合はこちらをご確認ください。

 

Information of the past

 

Application software on TSUBAME    ソフトウエア配布のアプリを含む

2017.3.27 17:00 license servers are not running because of "年度末メンテナンス、TSUBAME3.0導入工事に伴うTSUBAMEの停止について(2017春)".

new 2017.3.17 20:45 20:08頃復旧しました。詳細な発生期間や原因などをまとめています。来週掲載いたします。

new 2017.3.17 19:40 MDTのリカバリ処理が行われています。ロックファイルがあると数回リトライされるため復旧時刻は未定です。

new 2017.3.17 19:00 残念ながら復旧に時間がかかっています。現在は復旧の目処が立っておりません。

new 2017.3.17 18:00 順調に作業が終われば18:30頃の復旧となります。

new 2017.3.17 17:50 まだ復旧の目処が立っておりません。

new 2017.3.17 16:50 何らかの原因で復旧処理が失敗し現在/work1, /gscr0全領域にアクセスできない状態となっていおります。復旧時刻は未定となります。進捗がありましたらこちらへ追記いたします。

new 2017.3.17 16:45 現在、3月14日のストレージコントローラ障害の修理作業及び復旧作業を行なっています。大きな影響はない予定でしたが一時的に/work1, /gscr0の応答がなくなる現象が発生していることを確認しています。アクセスできない場合はしばらくお待ちください。現在、復旧作業状況を確認中です。

2017.3.14 16:45 4台あるストレージコントローラの内の1台の電源に問題があり縮退しています。この1台とペアになるコントローラが処理を代わりに引き受け負荷が偏っているため、その分だけパフォーマンスが低下する可能性があります。

2017.3.14 15:00 /work1, /gscr0の領域にパフォーマンスが低下する問題が発生していることがわかりました。現在調査を行なっています。

Information of the past

 

 

TSUBAME2.5 Portal

2017.3.27 17:00 unavailable because of "年度末メンテナンス、TSUBAME3.0導入工事に伴うTSUBAMEの停止について(2017春)".

 

Information of the past

 

TSUBAME Hosting Service(general)

2017.3.27 17:00 Available.

 

個別のサービス稼動状況については、そのサービス管理者へお問い合わせください。

 

Information of the past

 

TSUBAME Hosting Service(License server hosting)

2017.3.27 17:00 Available.

サービス対象:ccls3.g.gsic.titech.ac.jp, ccls5.g.gsic.titech.ac.jp, ccls6.g.gsic.titech.ac.jpの3ホスト

Information of the past

 

Large format printer

The printer has been removed.

Service hours 9:00-17:00

Information detail