このページの更新は終了しました。

最新の情報はTSUBAME3.0計算サービスのWebページをご覧ください。

TSUBAME2.5からTSUBAME3.0へのデータ移行方法の資料はこちら

2015春のメンテナンス以後、プログラムがエラーになるのですが ? (2015/5/14 更新)

1.pgi15.1 コンパイラを使用して、以下のようなエラーが出る場合があります。

nvlink fatal   : Internal error: overlapping non-identical data pgacclnk: child process exit status 2:  
/usr/apps.sp3/isv/pgi/15.1/linux86-64/15.1/bin/pgnvd

この場合、コンパイルオプションに -ta=tesla:nordc を付加するか、
または、使用するpgiを15.4 にアップしてコンパイルしてください。

メンテナンスにおいて、OSと共に、MPI,cuda,compilerなどもバージョンアッフしています。
以前まで動作していたプログラムが動かなくなった場合、再コンパイルをお願いします。

2.MPIを使用したプログラムで No such file エラーがでる場合があります。
  MPIの環境も変化していますので、環境変数の設定なども再確認をお願いします。

 以下に例を示します(インタラクティブ)

> mpirun -np 2 ./oiALL 2
./oiALL: error while loading shared libraries: libmpi_f90.so.0: cannot open shared object file: No such file or directory
./oiALL: error while loading shared libraries: libmpi_f90.so.0: cannot open shared object file: No such file or directory
--------------------------------------------------------------------------
mpirun noticed that the job aborted, but has no info as to the process
that caused that situation.
--------------------------------------------------------------------------

> mpif90 -o oiALL ALLtoALL.f90
> mpirun -np 2 ./oiALL 2
MPI_ALLTOALL (isize,irank,byte,time) :      2     0             16   0.0000240803
>

3.cudaライブラリでエラーが発生する場合があります。
./gpumpif: error while loading shared libraries: libcudart.so.6.0: cannot open shared object file: No such file or directory
この場合、春のメンテナンスでcudaが6.5にアップされていますので、
> . /opt/cuda/6.0/cuda.sh
として、それまでのcuda6にバスを通すことで動作できます。
> ./gpumpif
  irank=           0  Nsize=        5000  Nst=           1  Ned=        5000
using GPU #0
  TIME=   0.5274911       719399999.999999     
>