「ジョブ管理システム PBSを用いた計算機の利用」の版間の差分

提供:biaswiki
ナビゲーションに移動 検索に移動
17行目: 17行目:
<tr>
<tr>
     <td><div align="center"></div></td>
     <td><div align="center"></div></td>
     <td colspan=3><div align="center">'''分散並列処理型 : parallel distributed processing'''</div></td>
     <td colspan=4><div align="center">'''分散並列処理型 : parallel distributed processing'''</div></td>
   <td colspan=3><div align="center">'''共有メモリ型 : shared memory'''</div></td>
   <td colspan=3><div align="center">'''共有メモリ型 : shared memory'''</div></td>
   </tr>
   </tr>
25行目: 25行目:
     <td><div align="center">'''medium'''</div></td>
     <td><div align="center">'''medium'''</div></td>
     <td><div align="center">'''large'''</div></td>
     <td><div align="center">'''large'''</div></td>
  <td><div align="center">'''blast'''</div></td>
   <td><div align="center">'''smps'''</div></td>
   <td><div align="center">'''smps'''</div></td>
   <td><div align="center">'''smpm'''</div></td>
   <td><div align="center">'''smpm'''</div></td>
34行目: 35行目:
     <td><div align="center">中規模</div></td>
     <td><div align="center">中規模</div></td>
     <td><div align="center">長時間</div></td>
     <td><div align="center">長時間</div></td>
    <td><div align="center">nr検索</div></td>
     <td><div align="center">中メモリ</div></td>
     <td><div align="center">中メモリ</div></td>
   <td><div align="center">大メモリ</div></td>
   <td><div align="center">大メモリ</div></td>
43行目: 45行目:
     <td><div align="center">bias5-node01~node20</div></td>
     <td><div align="center">bias5-node01~node20</div></td>
   <td><div align="center">bias5-node01~node20</div></td>
   <td><div align="center">bias5-node01~node20</div></td>
<td><div align="center">bias5-node01~node20</div></td>
     <td><div align="center">bias5-smp</div></td>
     <td><div align="center">bias5-smp</div></td>
     <td><div align="center">bias5-smp</div></td>
     <td><div align="center">bias5-smp</div></td>
52行目: 55行目:
     <td><div align="center">72hr</div></td>
     <td><div align="center">72hr</div></td>
   <td><div align="center">no limit</div></td>
   <td><div align="center">no limit</div></td>
<td><div align="center">72hr</div></td>
   <td><div align="center">no limit</div></td>
   <td><div align="center">no limit</div></td>
   <td><div align="center">no limit</div></td>
   <td><div align="center">no limit</div></td>
62行目: 66行目:
     <td><div align="center">96GB</div></td>
     <td><div align="center">96GB</div></td>
     <td><div align="center">96GB</div></td>
     <td><div align="center">96GB</div></td>
  <td><div align="center">188GB</div></td>
     <td><div align="center">500GB</div></td>
     <td><div align="center">500GB</div></td>
     <td><div align="center">1TB</div></td>
     <td><div align="center">1TB</div></td>
71行目: 76行目:
     <td><div align="center">no limit</div></td>
     <td><div align="center">no limit</div></td>
     <td><div align="center">no limit</div></td>
     <td><div align="center">no limit</div></td>
<td><div align="center">no limit</div></td>
     <td><div align="center">12</div></td>
     <td><div align="center">12</div></td>
     <td><div align="center">6</div></td>
     <td><div align="center">6</div></td>
80行目: 86行目:
     <td><div align="center">200</div></td>
     <td><div align="center">200</div></td>
     <td><div align="center">20</div></td>
     <td><div align="center">20</div></td>
<td><div align="center">120</div></td>
     <td><div align="center">48</div></td>
     <td><div align="center">48</div></td>
     <td><div align="center">48</div></td>
     <td><div align="center">48</div></td>
86行目: 93行目:
<tr>
<tr>
     <td><div align="center">Max. num of running cpus / host</div></td>
     <td><div align="center">Max. num of running cpus / host</div></td>
     <td colspan=3><div align="center">40</div></td>
     <td colspan=4><div align="center">40</div></td>
     <td colspan=3><div align="center">72</div></td>
     <td colspan=3><div align="center">72</div></td>
   </tr>
   </tr>
  <tr>
  <tr>
     <td><div align="center">Max.num of running jobs / user.server </div></td>
     <td><div align="center">Max.num of running jobs / user.server </div></td>
     <td align="center" colspan=6>480</td>
     <td align="center" colspan=7>480</td>
   </tr>
   </tr>
   <tr>
   <tr>
98行目: 105行目:
     <td><div align="center">150</div></td>
     <td><div align="center">150</div></td>
     <td><div align="center">10</div></td>
     <td><div align="center">10</div></td>
    <td><div align="center">80</div></td>
     <td><div align="center">no limit</div></td>
     <td><div align="center">no limit</div></td>
     <td><div align="center">no limit</div></td>
     <td><div align="center">no limit</div></td>
107行目: 115行目:
     <td><div align="center">1</div></td>
     <td><div align="center">1</div></td>
     <td><div align="center">1</div></td>
     <td><div align="center">1</div></td>
<td><div align="center">20</div></td>
     <td><div align="center">1</div></td>
     <td><div align="center">1</div></td>
     <td><div align="center">1</div></td>
     <td><div align="center">1</div></td>
116行目: 125行目:
     <td><div align="center">3.5GB</div></td>
     <td><div align="center">3.5GB</div></td>
     <td><div align="center">3.5GB</div></td>
     <td><div align="center">3.5GB</div></td>
<td><div align="center">98GB</div></td>
     <td><div align="center">250GB</div></td>
     <td><div align="center">250GB</div></td>
     <td><div align="center">500GB</div></td>
     <td><div align="center">500GB</div></td>

2019年12月5日 (木) 05:59時点における版

ジョブ管理システム

  • 残念なお知らせですが、cat キューは終了となりました

利用可能なキュー

キュー一覧

分散並列処理型 : parallel distributed processing
共有メモリ型 : shared memory
queue
small (default)
medium
large
blast
smps
smpm
smpl
ジョブの特徴
短時間・並列多
中規模
長時間
nr検索
中メモリ
大メモリ
最大メモリ
Avairable hosts
bias5-node01~node20
bias5-node01~node20
bias5-node01~node20
bias5-node01~node20
bias5-smp
bias5-smp
bias5-smp
Max. execution time / job
6hr
72hr
no limit
72hr
no limit
no limit
no limit
Max. memory usage / job
96GB
96GB
96GB
188GB
500GB
1TB
3TB
Max.num of running jobs / queue
no limit
no limit
no limit
no limit
12
6
2
Max. num of running cpus / queue
580
200
20
120
48
48
36
Max. num of running cpus / host
40
72
Max.num of running jobs / user.server
480
Max.num of running jobs / user.queue
400
150
10
80
no limit
no limit
no limit
Default num of CPUs
1
1
1
20
1
1
1
Default memory size
3.5GB
3.5GB
3.5GB
98GB
250GB
500GB
1500GB


  • キューの稼働状況はこちらをご覧ください[1]
  • キューを指定しない場合、デフォルトでは「small」で実行されます。
  • 480個以上のジョブを投入すると481個目からは待ち状態になります。アレイジョブも同様


実行例

BLAST実行ジョブ(シェルスクリプト)の例 (ファイル名:blast.job) (下記の「ジョブスクリプトオプション」も参考にしてください)

#!/bin/sh
#PBS -q small
#PBS -l ncpus=4
#PBS -J 1-10
 cd ${PBS_O_WORKDIR}
 blastx -db nr -i -num_threads ${NCPUS} -query /home/xxx/sample.fa.${PBS_ARRAY_ID}  -o /home/xxx/sample.out.${PBS_ARRAY_ID}

ジョブをPBSで実行(qsubコマンドにジョブファイルを渡す)

$ qsub blast.job

全ユーザのジョブの様子を見る

$ qstat

特定ユーザのジョブの様子を見る

$ qstat -u user_name

3日前までに終了したジョブ番号 job_id のジョブ履歴を確認する

$ tracejob -n3 job_id

PBSコマンド早見表

投入後のジョブにコマンドを発行できるのは、ジョブを投入したユーザのみです。詳しいオプションはmanコマンドなどで確認してください。

コマンド
説明
qsub
ジョブを投入する
qstat
全ジョブの状態を表示する
qstat -Q
全キューの状態を表示する
qstat -u "user_name"
指定ユーザのジョブとキューの状態を表示する(デフォルトは全員分表示)
qstat -rn1
実行中の全ジョブとその詳細を表示する(アレイジョブ以外)
qstat -J -t -rn1
実行中の全アレイジョブとその詳細を表示する
qstat -f job-ID
指定したIDのジョブ詳細を表示する
qdel job-ID
指定したIDのジョブを削除する
qhold job-ID
指定したIDのジョブ(待機中のみ)をホールドする
qrls job-ID
ホールド状態のジョブをリリースする
qhost
各ノードの状態を表示する
qmod -sj job-ID
実行中のジョブをサスペンドする
qmod -usj job-ID
サスペンド中のジョブを再実行する
qmod -cj job-ID
エラーになったジョブを再実行する
tracejob -nDAY job-ID
DAY日間以内に終了したjob-IDの履歴を表示


ジョブスクリプトオプション早見表

オプション
説明
#PBS -o filename
標準出力の結果を指定したファイルに保存(指定しないとホームディレクトリにファイルが作られる)
#PBS -e filename
標準エラー出力の結果を指定したファイルに保存(指定しないとホームディレクトリにファイルが作られる)
#PBS -q queue_name
キューを指定してジョブを実行
#PBS -V
現在の環境を引き継ぐ
#PBS -v 環境変数名=環境変数
環境変数をジョブに渡す。書き方例:JAVA_HOME="/home/xxxxx/jdk-1.8.1"
ここで元の環境変数を参照することはできない。つまり PATH=/home/xxxxx/bin:$PATH 等と書いても「$PATH」は無視される
#PBS -N job_name
ジョブ名を指定する
#PBS -s shell_name
ジョブスクリプトを指定したシェルで実行
#PBS -a MMDDhhmm
ジョブの開始日時を指定
#PBS -l mem=8G
ジョブが使うリソース量を指定:メモリを8GBまで使う 
#PBS -l select=1:ncpus=10
ジョブが使うリソース量を指定:1ノードを用いて10スレッド使う 
#PBS -J 開始番号-終了番号