このページの更新は終了しました。

最新の情報はTSUBAME3.0計算サービスのWebページをご覧ください。

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

バッチシステム

let us know the handling from 9 am to 10 am when booking for more than 2 consecutive days.

If it is 2 days secured continuously, it can be used without cutting.
If you secure 2 days separately, you can not use 9 o'clock to 10 o'clock.

For example, in the case of 12/22 10: 00-12 / 24 9:00, you can use for 47 hours continuously.

12/22 10: 00 ~ 12/23 9: 00 and 12/23 10: 00 ~ 12/24 9: 00 separately
If you do, it will not connect and the machine will be separate.

英語

2日以上連続で予約した場合の午前9時から10時までの取り扱いを教えてください。

連続で確保した2日でしたら切れることなく使えます。
別々に2日確保した場合は9時から10時は使えなくなります。

たとえば、12/22 10:00~12/24 9:00 の場合は途中で切れません。
12/22 10:00~12/23 9:00 と 12/23 10:00~12/24 9:00と別々に
とった場合、つながりませんし、マシンも別になります。

日本語

小さい計算を大量に投入したいのですが,最大限投入できるジョブ数はいくつでしょうか?

バッチジョブとしての制限は 手引きの 3.1.6 制限一覧の3番 にありますように10000本になっておりますが、
計算の粒度が小さい場合や本数が多すぎる場合などに、PBSの処理が追いつかない場合があります。

同時に実行されるジョブはSの場合は30本、Vの場合は購入口数になりますので、処理待ちがあまり
大きくならない程度の本数でまとめていただけますようにお願いしております。また、PBSの処理が
重くなっている場合は投入されたジョブの削除をお願いする場合もあることを含みおきください。

日本語

It is waiting, although the node is vacant at queue.

Often large job is caused to have been scheduled.
Please identify the cause of the problem according to the chart of the next Web page.

投入したジョブが実行されない場合の確認手順
http://tsubame.gsic.titech.ac.jp/node/1381

英語

Job will fail with error while loading shared libraries

 Youmay recive an error message at the job execution..

./a.out: error while loading shared libraries: libcudart.so.7.0: cannot open shared object file: No such file or directory

Cause is because the path of the library is not correct.
Whether the path is through it can be found in the ldd command.
Which has become not found incorrect.

英語

ノードが空いているのにジョブが実行されません

 様々な理由が考えられますが、計算ノードがたくさん空いている場合は大規模ジョブがスケジュールされていることが原因である場合が多いです。次のWebページのチャートに従って原因を特定してください。こちらで解決できなかった場合はお問い合わせまでご連絡ください。

投入したジョブが実行されない場合の確認手順
http://tsubame.gsic.titech.ac.jp/node/1381

日本語

ジョブ実行時に error while loading shared libraries が出力されて失敗する場合の対応方法

 ジョブ実行時に次のようなエラーメッセージが出力される場合があります.

./a.out: error while loading shared libraries: libcudart.so.7.0: cannot open shared object file: No such file or directory

原因はライブラリのパスが正しく設定されていないためです.
ライブラリパスが通っているかどうかは ldd コマンドで確認できます.not found となっているものは正しく設定されていないです.

$ ldd ./a.out
...
libcudart.so.7.0 => not found
...

対応としては,環境変数設定としてライブラリパスを通してください.次のコマンドで設定できます.バッチジョブとして投入する場合は,下記「t2sub でジョブ投入する場合」の通り,環境変数設定をしてください.

日本語

Please tell me about process mapping of OpenMPI 1.8.2

Two versions of 1.6.5 and 1.8.2 of OpenMPI are available in the Thin calculation node of TSUBAME (at February, 2015). It is different which node you map a process onto every rank in these two versions. In this FAQ, I explain movement of the mapping of version 1.8.2 and a change method.

英語

Please tell me the batch queue trial use

If it is a person having an account of TSUBAME, I can carry out a job for trials gratis.
In addition, I hope that I do not perform a full-scale calculation because it is the service of the trial use.

We explain the details about the trial use here.

Use qualification

There is no use qualification becoming necessary for addition in particular if you have an account of TSUBAME.

英語

ページ