TSUBAME3.0計算サービスのWebページはこちら

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

現在のTSUBAMEの運用状況

現在のTSUBAME2.5の運用状況:データ移行運用・10/31でサービス終了・すべてのデータが消えます

もっと詳しく表示する


TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

夏季一斉休業・停電に伴うTSUBAME計算サービスの停止について(8/9から8/16)

配布アプリケーションが動かなくなった場合

TSUBAME3.0 Q&A

2017年度のTSUBAMEの運用予定について(TSUBAME3)

投入したジョブが実行されない場合の確認手順

 TSUBAMEの既知の問題一覧はこちら


過去に発生した個別の障害はこちら。システムの主な自動チェック項目はこちら


 ネットワーク

2017.8.4 17:05 TSUBAME内部のEthernetでパケットロスすることが確認されています。Infiniband側では問題なさそうです。loginノードからインタラクティブノードの間はEthernetで通信しているため、ほぼ全てのターミナルやGUIに遅延が発生します。

2017.8.4 15:15 何らかの通信の問題が発生しており一部遅延することが確認されています。

キャンパスネットワーク(Titanet3)の障害・メンテナンス情報はこちらで御確認下さい。TSUBAMEへの通信はキャンパスネットワークを経由して行われます。

過去の情報はこちら

 

ログイン(インタラクティブ,I/O専用ノード)

2017.9.11 17:00 利用できます。

2017.8.16 18:15 運用再開しました。

過去の情報はこちら

 

バッチキュー

2017.9.11 17:00 利用できます。

2017.8.16 18:15 運用再開しました。

2017.7.27 15:00 移行運用で再開しました。

 

現在の各キューの稼動状況はこちらジョブを効率よく実行したい場合はこちら。ノード台数は故障等により常に増減します。

 

 

 

過去の情報はこちら

 

TSUBAMEストレージ      HPCI共用ストレージはこちら

2017.9.11 17:00 利用できます。

new 2017.9.6 10:25 /work0の障害は復旧しました。

new 2017.9.4 13:50 /work0の障害は4台あるうちの1台のOSSのハードウエア障害であり、サービスを片寄して仮復旧しています。

new 2017.9.4 10:20 /work0の一部に障害が発生し一部のファイルディレクトリにアクセスできない状態となっています。

2017.8.16 18:15 運用再開しました。

2017.7.27 18:50 フェイルオーバを行い仮復旧しました。なお/homeには影響はございませんでした。

2017.7.27 17:10 4台ある/homeやシステム領域を管理するサーバのうちの1台に不具合が発生しており調査しております。

2017.6.30 17:50 本日の/work1の障害についてお知らせに掲載しました

2017.6.30 16:20 /work1の障害は復旧しております。内容や時刻はわかり次第後ほどお知らせに掲載します。

2017.6.30 12:15 /work1に障害が確認されています。現在対応を開始しています。

2017.6.27 14:40 "【障害報告】2017.6.26発生:/work1 ストレージ障害"を掲載しました。

2017.6.23 15:30 /data0の障害ですが何らかの理由によりnfsd の処理滞留が発生し、その後、監視機能により/data0を構成するサーバが再起動したことが原因でした。この場合影響範囲が全体になるので処理を見直し、問題の発生した計算ノードに限定するよう処理を変更しました。

2017.6.23 11:50 昨日の23:00頃より今日9:40頃まで/data0に障害が発生しておりました。現在調査中です。

2017.6.5 9:45 /wrok1に障害が発生し復旧しました。発生期間は6月3日(土)12:50 から 6月4日(日)13:24頃です。

2017.5.30 10:30 /wrok1に障害が発生し復旧しました。発生期間は 5/29 18:51 から 5/29 19:55 です。

2017.5.15 10:45 /work1の障害は10:27頃復旧しました。

2017.5.15 09:45 /work1に障害が発生していることを確認しました。現在対応中です。

2017.5.12 16:20 5/11にも/work1に障害が発生していたことがわかりました。障害情報をこちらに掲載しました。

2017.5.11 10:20 5/9の障害情報をこちらに掲載しました。

2017.5.10 12:00 掲載が遅くなってしまいましたが/work1の障害は昨日の14:00頃には仮復旧しています。詳細は後ほど掲載します。

2017.5.9 11:30 /work1に障害が発生しており復旧作業中です。 

2017.5.1 15:30 調査の結果/gscr0に障害はありませんでした。ただし現在/work1のMDS(t2s007015)の機能が、対となる/gscr0側(t2s007013)に寄った状態となっています。/gscr0の負荷は普段は特に高くないためパフォーマンスにはほとんど影響しないと思われます。少なくとも本日9:16から10:54まで/work1が利用できませんでした。

2017.5.1 10:40 /work1, /gscr0に障害は復旧しました。正確な期間などは後ほど掲載します。(修正)

2017.5.1 10:25 /work1, /gscr0に障害が発生しておりアクセスできません。復旧作業中です。(修正)

グループディスクに書き込めない場合はこちらをご確認ください。をご覧ください。

 

過去の情報はこちら  

 

TSUBAMEアプリケーション  ソフトウエア配布のアプリを含む

利用終了しました。

new 2017.8.1 17:00 T2のライセンスは運用を終了しました。詳しくはこちら

過去の情報はこちら

 

 

TSUBAME2.5利用ポータル

2017.9.11 17:00 利用できます。

new 2017.8.16 18:00 運用再開しました。

new 2017.7.27 15:00 移行運用で再開しました。

 

過去の情報はこちら

 

 

TSUBAMEホスティングサービス(一般ホスティング)

2017.9.11 17:00 利用できます

2017.08.21 14:35 vest24が3:30頃から不安定となっていることを確認しました。5:30頃に一部の仮想マシンを除いて復旧が完了しました。

2017.7.19 19:10 本日10:40頃ストレージに障害が発生し復旧しました。ただし障害により多数の仮想マシンのI/Oがタイムアウトし、その間にアクセスしていた仮想マシン上のファイルが破損した可能性があります。

 

個別のサービス稼動状況については、そのサービス管理者へお問い合わせください。 

過去の情報はこちら

 

TSUBAMEホスティングサービス(ライセンスサーバーホスティング)

2017.9.11 17:00 利用できます。

 

サービス対象:ccls3.g.gsic.titech.ac.jp, ccls5.g.gsic.titech.ac.jp, ccls6.g.gsic.titech.ac.jpの3ホスト

過去の情報はこちら

 

大判プリンター

2016年度末で大判プリンタのサービスを終了しました。

利用時間 9:00-17:00

運用予定の詳細はこちら