TSUBAME3.0計算サービスのWebページはこちら

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

TSUBAME2計算サービス種別

TSUBAME2では、1442台の計算ノードを以下のサービス区別に従って提供します。

名称 利用方法 用途 課金
インタラクティブサービス ssh等でログインした際に使われるノード プログラムの開発やジョブの投入。ジョブの実行には利用できません。 無料
バッチサービス バッチキューにジョブを投入し、ノードが利用可能になった時点で実行。ノードを占有するタイプと共有するタイプがあります。 小規模から中規模のジョブ 無料/有料
予約サービス カレンダー画面より空きノード・時間を指定して予約 大規模ジョブの実行や、時間を指定しての実行 有料
超大規模並列サービス 年数回、他のサービスを一時的に停止し、上記サービスより大規模な並列ジョブの実行ができます。    

以下にそれぞれの概要を説明します。詳細は利用の手引きを参照してください。

バッチサービス

使いたいプロセッサ数やメモリ量等の条件をあらかじめ指定し、それが利用可能になった時点で指定されたプログラムを実行するTSUBAME計算サービスのメインとなるサービスです。

TSUBAMEではジョブスケジューラと呼ばれる計算ノードの利用を調停するシステムがあり、ジョブスケジューラが利用者のプログラムを適宜計算ノードに割り当てて実行していきます。ジョブ管理システムと呼ぶ事もあります。ここで実行するユーザのプログラムの一つをジョブと呼び、プログラムの実行を登録することをジョブの投入と言います。ユーザが投入したジョブはキューと呼ばれるシステムに登録され資源が空くまで順番待ちをします。TSUBAMEのシステムでは基本的には先に投入されたジョブから順番に実行されていきます。

TSUBAME2ではバッチサービスとして利用形態に応じたいくつかの種類を提供しています。

  • ノード占有キュー(S, S96, L128, L128F, L256, L512, X(*))     *Xキューは直接指定できません
  • ノード共有キュー(U, V)
  • GPU専用ノード占有キュー(G)
  • Windowsキュー

ノード占有キューでは単一の計算ノードを個々のジョブで占有して用い、TSUBAME1のSLAに相当します。ノードあたりのメモリサイズやGPUの種類の違いにより、S(X), S96, L128, L128F, L256, L512, 6種類のキューが利用可能です。

ノード共有キューは単一ノードを複数ジョブで仮想化により共有して利用する方式であり、U, Vキューが該当します。これはTSUBAME1のBESに相当します。このノードではGPUは使えません。アレイジョブのような並列化されてない単一プロセッサを使う逐次ジョブを大量に実行する場合に適しており、逆にノード間の高速通信を要求するような場合には適していません。

GPU専用ノード占有キューはノードあたり3GPUと4CPUコアが使えるCPUコアは多くは使わないGPUプログラムに特化したキューです。物理的にはU, Vキューと計算機を共有しています。

予約サービス

本サービスは指定した日時に指定したノード数を占有して使う方式です。多数のノードを用いる大規模実行に適しているという特徴や、後述のバッチサービスとは異なり利用可能な日時があらかじめ確定しているという特徴があります。

予約期間の最小単位を「スロット」と呼びます。1スロットは朝10:00から翌日の朝9:00の23時間です。スロットは「YYYY-MM-DD」の形で表現されます。「2012-01-10」のスロットを予約した場合は2012年1月10日10:00から2012年1月11日9:00の23時間が利用できます。

毎日朝9:00から朝10:00の1時間はメンテナンスが行われ利用できませんが、一回の予約で連続したスロットを予約した場合は途切れることなく、最終スロットまで連続して利用する事が出来ます。例えば「2012-01-10」から「2012-01-12」を予約した場合は、分割された23+23+23時間ではなく、連続した71時間利用できます。

最小で16ノードから最大420ノードまで1ノード単位で、1スロット1日単位で最長1週間まで予約できます。ただし、特定ユーザによる占有を防止するため、ノード数×スロット数の最大値は616(Hキュー2週間分の全資源量の10%)となっています。

予約はTSUBAME2.0利用ポータルから行うことができ、実際の利用に関わらずノード数×スロット数単位で従量課金に置けるTSUBAMEポイントで支払います。詳細は利用ガイドをご覧ください。

予約はスロット開始1時間前(当日の9:00)まで、予約のキャンセルはスロット開始の24時間前(前日の10:00)まで可能です。

改修に伴い2011年12月より仕組みが若干変更となっております。詳しくはこちらをご覧ください。

 

キューの無料お試し

バッチキューは基本的にすべて有料サービスですが、課金する前の動作確認用に各キュー毎に以下の条件のもとキューを無料でお使い頂けます。対象となるキューはU,S,S96,L128,L128F,L256,L512,Vです。あくまでお試しです。これら仕組みを利用して本格的に研究する行為は禁止です。

  • U,S,S96,L128,L128F,L256,L512キュー
    • 1ジョブあたり2ノードまで
    • 同時に2ジョブまで
    • 実行時間は10分まで
  • Vキュー
    • 1ジョブあたり2CPUまで
    • 同時に2ジョブまで
    • 実行時間は10分まで

無料お試しキューへのジョブ投入方法は以下の通りです。

t2sub -q S -l 他のオプション ジョブスクリプト

対象のキュー名を指定し(この例ではSキュー)、グループ名は指定しないでください。例えば、2ノード、各ノードあたり12プロセスを用いて job_script.sh というジョブスクリプトファイルを実行する場合は以下のように t2sub コマンドを使います。

t2sub -q S -l select=2:mpiprocs=12 -l place=scatter job_script.sh

 超大規模並列サービス

TSUBAME共同利用 グランドチャレンジ大規模計算制度をご覧ください。