The current TSUBAME operational status

The current TSUBAME operational status

 

現在発生している/data0障害についてこちらに掲載しました。 


 過去に発生した個別の障害はこちらで確認できます。

  • Login(Interactive Nodes)

2012.5.16 10:30 Working. But, because system was under heavy load, so some users may not be able to login.

2012.5.15 9:40 本日朝、次のインタラクティブノードが高騰していたため再起動を行いました。t2a006172

2012.5.11 10:40 以後、高負荷によって再起動したインタラクティブノードについて /home のマウントパラメータの変更を行います。利用方法等に変更はございません。

Information of the past 

  • Batch queue

2012.5.16 10:30 Working /homeのマウントパラメータを変更するためXキューが一時的に減少することがあります。

(new) 2012.5.16 10:30 Because system was under heavy load, we have rebooted following nodes. We don't charge for running jobs which affected the event. Jobs which affected the event reran.
469608.t2zpbs01, 469739.t2zpbs01, 469695.t2zpbs01, 469697.t2zpbs01, 469749.t2zpbs01, 469710.t2zpbs01, 469713.t2zpbs01, 469708.t2zpbs01

2012.5.15 9:40 Because system was under heavy load, we have rebooted following nodes. We don't charge for running jobs which affected the event. Jobs which affected the event reran.
469011.t2zpbs01, 1302835.t2zpbs01, 469304.t2zpbs01

2012.5.14 13:30  Because system was under heavy load, we have rebooted following nodes. We don't charge for running jobs which affected the event. Jobs which affected the event reran.
468689.t2zpbs01, 468180.t2zpbs01, 468880.t2zpbs01, 468686.t2zpbs01, 467517.t2zpbs01, 468726.t2zpbs01,
468943.t2zpbs01, 468914.t2zpbs01, 468684.t2zpbs01, 468725.t2zpbs01, 468845.t2zpbs01, 468494.t2zpbs01,
468989.t2zpbs01, 468005.t2zpbs01

Because system is under heavy load, we will reboot following nodes. 1301730.t2zpbs0, 1302345.t2zpbs0, 1302505.t2zpbs0, 1302506.t2zpbs0

(new) 2012.5.11 10:40 /home にアクセスすると高負荷になる問題で、本日、マウントパラメータの変更を行うため、Xキューのノードが一時的に減少する事があります。

現在の各キューの稼動状況はこちら。ジョブを効率よく実行したい場合はこちら

Information of the past

  

  • Storage 

2012.5.16 10:30 Working, but nodes may hang up by writing to /home. 

(new) 2012.5.11 10:40 /home にアクセスすると高負荷になる問題で、今後マウントパラメータの変更を行います。

2012.4.16 12:10 メンテナンス以降/homeにたくさんのIOを行うとノード全体がハングアップしてしまう状態が頻発しており、調査を続けております。

Information of the past

 

  • License server of application software on TSUBAME

2012.5.16 10:30 Available.

2012.3.30 12:00 予定通り、サービスを再開致しました。

Information of the past

 

  • TSUBAME2.0 Portal

2012.5.16 10:30 Available.

Information of the past

 

  • TSUBAME Hosting Service(general)

2012.5.16 10:30 Available, but the speed of the storage has decreased by Infiniband failure.

(new) 2012.5.15 9:50 vest14は現在正常に動作しているようです。念のため仮想ホストを他のホストへ移動し、vest14の再起動を行う予定です。

(new) 2012.5.14 14:45 We recognized that vest16 might be under heavy load. 221, 231, 311, 321, 331, 341, 352, 381,391, 392, 401, 441, 442, 443 may be affected.

(new) 2012.5.1 17:30 すずかけ台ホスティングのメンテナンスについてこちらに掲載しました。

2012.4.5 10:00  TSUBAMEのメンテナンス以降ホスティングからのみInfinibandが利用できず、キャンパスネットワークを経由してストレージにアクセスしてい る状態が続いております。当分の間この状態が継続する可能性がございます。そのため、ストレージの速度が普段より遅い、キャンパスネットワーク障害でスト レージアクセスがタイムアウトする、等の問題が発生する可能性がございます。

個別のサービス稼動状況については、そのサービス管理者へお問い合わせください。

Information of the past

 

TSUBAME Hosting Service(License server hosting)

2012.5.16 10:30 Available.

サービス対象:ccls.g.gsic.titech.ac.jp, ccls2.g.gsic.titech.ac.jp, ccls3.g.gsic.titech.ac.jp

Information of the past