TSUBAME3.0計算サービスのWebページはこちら

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

ジョブを削除できません。ジョブが終了しません。

 マシン負荷が高騰してしまった場合や、障害が発生した場合にジョブが終了できなくなる場合があります。
ジョブを終了させる場合、次の手順で操作してください。

t2statでジョブの状況を確認します。

Job id            Name             User         Time Use S Queue
----------------  -------------- -------------  -------- - -----
1202004.t2zpbs03  OTHER           xxxxxxx              0 S G 

このとき、ジョブ名を確認してください。表示落ちしている場合があります。
Job id            Name             User         Time Use S Queue
----------------  -------------- -------------  -------- - -----
1609830.t2zpbs03  OTHERS           xxxxxxxxx          03:30:28 R G               
1609865[].t2zpbs0 OTHERS           xxxxxxxxx                 0 B G
1960982.t2zpbs-v   OTHERS          xxxxxxxxx          01:00:10 R V

この例の場合、アレイジョブ表示とVキュージョブの表示が桁落ちしています。
job-IDの最後は必ず"1"以上の整数ですので、最後が"0"や"V"の場合は表示が桁落ちしています。
この場合、以下のどちらかで対応してください。

(1) オプションを付加します 
  t2stat -H S -w  
    などと、"-w"を付加すると、表示枠が拡大されます。

(2) ジョブ名の補完
  ジョブ名はキューによって若干違いますが、この例のGキュージョブの
  ジョブ名は 1790865[].t2zpbs03 となります。pbsサーバーとキューの関係は次のようになります。
  S,S96,L系 -->  t2zpbs01
  G     ------->  t2zpbs03
  H,X     ----->  t2zpbs05
  U,V     ----->  t2zpbs-vm1

 このような名前になります。ジョブ名を確認した状態で、実行をまだ待っている場合は 

t2del 1202004.t2zpbs03

などとして5秒くらいお待ちください。

Job id            Name             User         Time Use S Queue
----------------  -------------- -------------  -------- - -----
1202004.t2zpbs03  OTHER           xxxxxxx       12:13:56 R G 

実行が始まっている場合は、

t2del -W force  1202004.t2zpbs03

などとして5秒くらいお待ちください。これでも終了できない場合、soudan宛にジョブの削除を依頼ください。

マシンがフリーズした場合などに終了できない状況になります。

 

「バッチジョブの結果リストが無いのですが。?」
http://tsubame.gsic.titech.ac.jp/node/635
こちらもあわせてご参照ください。