TSUBAME3.0計算サービスのWebページはこちら

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

繁忙期における注意事項について(12/22更新)

(TSUBAMEをご利用しているすべての方向けの情報です)

学術国際情報センター
2016年12月1日

【繁忙期における注意事項について(2016年度版)】

 卒論、修論の締切が近づくにつれて利用率が上がり、ジョブの待ち時間が長くなり、ジョブを実行できる機会が少なくなっていきます。余裕を持ったスケジュールで計画的にご利用いただくようお願いいたします。

 繁忙期において特に重要と思われる項目について以下にまとめましたので、利用者の皆様にはご一読いただきますようよろしくお願いいたします。

  1. walltimeを出来るだけ短く指定してください
  2. 混雑時は128ノードを超えるような大規模ジョブはH/Xキューを利用してください。
  3. 消費しきれなかったTSUBAMEポイントの扱いについて
  4. アカウントの有効期限について
  5. 卒業や異動に伴うデータの引継ぎのお願い
  6. 進学や異動後に継続してTSUBAMEを利用する場合のデータの扱い
  7. 年度末メンテナンスについて
  8. 年末年始および年度末におけるHキューの運用について
  9. /scr(内蔵SSD)を有効利用してください
  10. /work0ではなく/work1を利用してください
  11. 【重要】2月頃にTSUBAMEの全停止が予定されています(1/13追記)

 1.walltimeをできるだけ短くしてください

 ジョブは基本的に投入順に実行されます。次に実行されるジョブが並列ジョブの場合、計算ノードがいくつか空いていたとしても、実行に必要な台数を下回っていた場合、台数が揃うまで、それらのノードは何もせず待機することになります。もし、この並列ジョブの開始予定時刻までに終わるような短い時間を実行時間(walltime)に指定したジョブが、この後に投入されていた場合には、この隙間に埋めるように、並列ジョブを追い越してスケジュールするので、待ち時間が短くなる場合があります(バックフィル)。walltime値が無駄に大きいと、実行出来たはずのジョブが、この隙間に入らずに、資源を無駄にしてしまうことがあります。より実際の実行時間に近い値を指定してジョブを投入してください。
 以下はバックフィルの説明です。

 

下の図のように特に大規模並列ジョブ(4)がスケジュールされたときに、ノードが空いていてもwalltimeが長いジョブは実行されません。

2.混雑時は128ノードを超えるような大規模ジョブはH/Xキューを利用してください。

 1.の通り、一つのジョブが大きいほど待機するノード数も多くなるため、混雑時に大規模並列なジョブをSキューに投入しないでください。walltimeが短ければバックフィルされますが、すべてのジョブが短く出来るとは限りません。大規模並列ジョブはH/Xキューをご利用ください。稼働率を大きく下げることが予測されるジョブについては、システム管理者によって削除させて頂く場合があります。

 

3.消費しきれなかったTSUBAMEポイントの扱いについて

 TSUBAMEポイントの有効期限は年度末です。余ったTSUBAMEポイントは失効し、払い戻しや振替はできませんのでご注意ください。年度末には毎回メンテナンスが行われるため3/31まで利用できるわけではないことにご注意ください。

 

4.アカウントの有効期限について

 学生証・職員証・優遇されるアクセスカードによる利用のアカウントの有効期間については、「東京工業大学学術国際情報センター計算機システム利用細則」に規定されているとおり、東工大ICカードの有効期間となります。詳しくは次のFAQをご覧ください。

FAQ:アカウントはいつまで有効ですか?
http://tsubame.gsic.titech.ac.jp/node/52/

 休学などで卒業を前にICカードの有効期限を迎えてしまう場合は、次のページを参考に 
を参考に、ICカードの再発行を行ってください。

ICカードの申請・再発行
http://portal.titech.ac.jp/guide/iccard-apply.html

 有効期限末までに手続きが完了していないと、TSUBAMEのアカウントの状態が「削除待ち」となり、一時的にTSUBAMEを利用できなくなる場合があります。その場合、相談窓口へ削除待ちの解除の依頼をしてください。

 

5.卒業や異動に伴うデータの引継ぎのお願い

 毎年、データの引継ぎがきちんと行われておらず、今後の研究に必要なデータが読み出せない、といったお問い合わせを多数いただいております。

 容量もファイル数もディレクトリ構成も異なる様々なデータを管理者権限で一つ一つ操作するのは大変な危険を伴うため、
また、関係者といえ個人のデータを本人の同意無く他者が利用するということにセキュリティの問題があるため、データの移動や復旧作業の依頼は受けつけません

 次のページのようにアカウント無効になる前に必ず、研究室へ一度データを引き上げたり、グループディスクで適切なパーミッションを設定して、グループメンバーが読み書きできるよう変更してください。また不要なデータは出来るだけ削除してください。

データの引き継ぎ例
http://tsubame.gsic.titech.ac.jp/node/875

 

6.進学や異動後に継続してTSUBAMEを利用する場合のデータの扱い

 アカウントの種類が変更になるとuidも変更となるため、以前のアカウントのデータにアクセスすることができません。アカウントが失効する前に必要なデータを自分のコンピュータにダウンロードし、TSUABME上のデータは削除してください。ただし、「1.学生証・職員証」と「2.優遇を受けられるアクセスカード」間の変更については東工大ICカードの情報が引き継がれていればTSUBAMEのデータを引き継ぐことができます。詳しくは次のページをご覧ください。

進学や異動後に継続してTSUBAMEを利用する場合のデータの扱い
http://tsubame.gsic.titech.ac.jp/getting-account#shingaku

 

7.年度末メンテナンスについて

 具体的な実施日はまだ未定ですが、例年、3月の最終週頃から4月の初週にかけて一週間程度、年度末メンテナンスが実施されます。実施中はログインは一切できませんので、直前になってデータの取り出しが間に合わないと慌てないよう今後のアナウンスに十分ご注意ください。特にメンテナンス中にICカードの有効期限を迎えてしまうと、運用が再開してもデータに一切アクセスできなくなっていますのでご注意ください。主な年間予定は次のページで確認することができます。

年間スケジュール
http://tsubame.gsic.titech.ac.jp/node/663

 

8.年末年始および年度末におけるHキューの運用について

 昨年度同様、年末年始および年度末は予約(Hキュー)を休止し、Xキューのみのサービスとなります。なお、障害・混雑の状況によっては、利用者に周知した上で、追加でHキューを休止することがあります。詳しくは以下のお知らせをご覧ください。

年末年始および年度末におけるH/Xキューの運用について
http://tsubame.gsic.titech.ac.jp/node/1527

 

9./scr(内蔵SSD)を有効利用してください

 たくさんのジョブ投入により特に/work1の負荷が高くなっております。ファイルのI/Oを見直して、アクセス回数を減らす。/scr(内蔵SSD)にあらかじめデータをコピーしてから計算し出力結果のみをworkに書き出すなどの負荷削減にご協力ください。

利用の手引き:4.6.5 ローカルスクラッチ
http://tsubame.gsic.titech.ac.jp/docs/guides/tsubame2/html/usage.html#us...

 

10./work0ではなく/work1を利用してください

 12月18日現在、/work0がほぼ売り切れ状態です。新規に購入する分は/work1を利用しでください。また/work0からデータを移動することもご検討ください。

 

11.【重要】2月頃にTSUBAMEの全停止が予定されています

 現在計画中の次世代のTSUBAMEの導入に向けて、情報センターの建物工事(link学内のみ)が進められています。その中で新たな電源を確保するため、全館停電を伴うTSUBAMEの停止が2月頃に予定されています。詳細な日程はまだ不明なため今後のアナウンスに十分ご注意ください。

 (12/22追記)現在、停止は2/17(金)から2/20(月)頃になるよう調整しております。論文の締切等大変厳しい時期であることは十分理解しておりますが、一連の工事の納期や次世代TSUBAMEの導入、入試日程などを考慮するとどうしてもこの日程での停止は避けられないため、どうかご理解とご協力をお願いいたします。停止期間が最短となるよう最大限努力いたします。今後のアナウンスに十分ご注意ください。

 (1/13追記)日時が確定しました。詳しくはこちら