TSUBAME3.0計算サービスのWebページはこちら

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

The current TSUBAME operational status

The current TSUBAME operational status: in services.


TSUBAME3.0 Q&A

ピークシフト2017.7

ストレージコントローラのメンテナンスが予定されています(7/5, 12, 19) (7/25更新)

2017年度のTSUBAMEの運用予定について (TSUBAME3)

投入したジョブが実行されない場合の確認手順

TSUBAMEの既知の問題一覧はこちら


過去に発生した個別の障害はこちら

システムの主な自動チェック項目はこちら


 

  • Network 

 

キャンパスネットワーク(Titanet3)の障害・メンテナンス情報はこちらで御確認下さい。

 

過去の情報はこちら

 

Login(Interactive Nodes, I/O node) 

2017.9.11 17:00 Available.

new 2017.8.16 18:15 運用再開しました。

 Information of the past

 

 

 

 

Batch queue

2017.9.11 17:00 Available.

new 2017.8.16 18:15 運用再開しました。

new 2017.7.27 15:00 移行運用で再開しました。

 

現在の各キューの稼動状況はこちらジョブを効率よく実行したい場合こちら。ノード台数は故障等により常に増減します。

 

Information of the past

  

Storage   HPCI共用ストレージはこちら

2017.9.11 17:00 Available.

new 2017.9.6 10:25 The problem has been fixed.

new 2017.9.4 10:20 The problem which was posted at 2017.9.4 13:50 was fixed because we have done the temporary countermeasure.

new 2017.9.4 13:50 We recognized occurrence of events that some file in /work0 can't be accessed.

new 2017.8.16 18:15 運用再開しました。

new 2017.7.27 18:50 フェイルオーバを行い仮復旧しました。なお/homeには影響はございませんでした。

new 2017.7.27 17:10 4台ある/homeやシステム領域を管理するサーバのうちの1台に不具合が発生しており調査しております。

2017.6.30 17:50 本日の/work1の障害についてお知らせに掲載しました

2017.6.30 16:20 /work1の障害は復旧しております。内容や時刻はわかり次第後ほどお知らせに掲載します。

2017.6.30 12:15 /work1に障害が確認されています。現在対応を開始しています。

2017.6.27 14:40 We posted "【障害報告】2017.6.26発生:/work1 ストレージ障害".

2017.6.5 9:45 /wrok1に障害が発生し復旧しました。発生期間は6月3日(土)12:50 から 6月4日(日)13:24頃です。

2017.5.30 10:30 /wrok1に障害が発生し復旧しました。発生期間は 5/29 18:51 から 5/29 19:55 です。

2017.5.15 10:45 /work1の障害は10:27頃復旧しました。

2017.5.15 09:45 We recognized /work1 failure. We are doing the corrective action.

2017.5.12 16:20 5/11にも/work1に障害が発生していたことがわかりました。障害情報をこちらに掲載しました。

2017.5.11 10:20 5/9の障害情報をこちらに掲載しました。

2017.5.10 12:00 掲載が遅くなってしまいましたが/work1の障害は昨日の14:00頃には復旧しています。詳細は後ほど掲載します。

2017.5.9 11:30 /work1に障害が発生しており復旧作業中です。

2017.5.1 15:30 調査の結果/gscr0に障害はありませんでした。ただし現在/work1のMDS(t2s007015)の機能が、対となる/gscr0側(t2s007013)に寄った状態となっています。/gscr0の負荷は普段は特に高くないためパフォーマンスにはほとんど影響しないと思われます。少なくとも本日9:16から10:54まで/work1が利用できませんでした。

2017.5.1 10:40 /work1, /gscr0に障害は復旧しました。正確な期間などは後ほど掲載します。

2017.5.1 10:25 /work1, /gscr0に障害が発生しておりアクセスできません。復旧作業中です。

グループディスクに書き込めない場合はこちらをご確認ください。

 

 

Information of the past

 

Application software on TSUBAME    ソフトウエア配布のアプリを含む

not running

new 2017.8.1 17:00 T2のライセンスは運用を終了しました。詳しくはこちら

Information of the past

 

 

 

TSUBAME2.5 Portal

2017.9.11 17:00 Available.

new 2017.7.27 15:00 移行運用で再開しました。

Information of the past

 

 

TSUBAME Hosting Service(general)

2017.9.11 17:00 Available.

 

2017.08.21 14:35 We recognized vest24 failure from 3:30. We have done the corrective action to fix the problem at 5:50. Now, the system works normally with the exception of some VIRTUAL MACHINE.

2017.7.19 19:10 本日10:40頃ストレージに障害が発生し復旧しました。ただし障害により多数の仮想マシンのI/Oがタイムアウトし、その間にアクセスしていた仮想マシン上のファイルが破損した可能性があります。

 

 

個別のサービス稼動状況については、そのサービス管理者へお問い合わせください。

 

Information of the past

 

TSUBAME Hosting Service(License server hosting)

2017.9.11 17:00 Available.

 

サービス対象:ccls3.g.gsic.titech.ac.jp, ccls5.g.gsic.titech.ac.jp, ccls6.g.gsic.titech.ac.jpの3ホスト

Information of the past

 

Large format printer

The printer has been removed.

Service hours 9:00-17:00

Information detail