HOME > 使い方と注意事項 > 計算サービス

計算サービスの使い方と注意事項

投入ジョブ・キュー情報の参照

投入ジョブの参照

PBSでは投入されたジョブの実行状況やキューの処理状況を確認するためのコマンドqstatが用意されています。ジョブの実行状況では、ユーザ自身のジョブのみが表示されます。

% qstat 
  Job id       Name             User              Time Use S Queue
  -----------  ---------------- ----------------  -------- - -----
  143.uva      testjob          fukumoto          01:03:11 R LARGE
  152.uva      JOB              fukumoto          23:15:26 R SMALL
  159.uva      fuku_JOB         fukumoto          23:02:26 R LARGE
  160.uva      fuku_JOB         fukumoto                 0 Q LARGE
項目説明
Job idPBSによって割り振られるジョブ番号
Nameジョブ名
Userジョブを投入したユーザ名
Time Use経過時間(時:分:秒)
Sジョブの状態
Queue実行中・実行予定のキュー名

ジョブの状態は以下に分類されます。

状態
説明
B
ジョブアレイのみに表記される状態です。(ジョブアレイが起動)
E
ジョブは実行済みで終了処理中です。
H
ジョブは保留状態です。
Q
ジョブはキュー待機状態です。
R
ジョブは実行中です。
S
ジョブはサーバによって中断中です。
(他の優先度の高いジョブに計算リソースが必要になると、ジョブは中段状態に入ります。)
T
ジョブは移行中です。
U
ジョブはワークステーションがビジー状態になったため中断中です。
W
ジョブは要求された実行時間になるまで待機中であるか、
ジョブは何らかの理由で失敗したステージイン要求を指定しています。
X
サブジョブのみに表記される状態です。(時間切れにより、サブジョブが終了)

ジョブ情報に関するqstatコマンドの主なオプション

オプション
機能
-a
ユーザのすべてのジョブに対する情報を表示します。
要求されたメモリ量や要求された経過時間、ジョブの状態の経過時間などが表示されます。
-r
-a オプションと同じフォーマットですが、実行中のジョブのみを表示します。
-f jobID
jobIDに対するもっとも詳細な情報を表示します。なお、f は full を意味します。

キュー情報の参照

qstatコマンドは、キュー情報の参照にも使用できます。

% qstat -Q
Queue              Max   Tot Ena Str   Que   Run   Hld   Wat   Trn   Ext Type
---------------- ----- ----- --- --- ----- ----- ----- ----- ----- ----- ----
JP1                  0     0 yes yes     0     0     0     0     0     0 Exec
UVM1                 0     0 yes yes     0     0     0     0     0     0 Exec
JP20                 0    23 yes yes     0    23     0     0     0     0 Exec
JP10                 0    24 yes yes     0    24     0     0     0     0 Exec
JP4                  0     7 yes yes     0     7     0     0     0     0 Exec
UV16                 0     0 yes yes     0     0     0     0     0     0 Exec
UV128                0     2 yes yes     0     2     0     0     0     0 Exec
EMERG                0     0 yes yes     0     0     0     0     0     0 Exec
UVNOLMT              0     0 yes yes     0     0     0     0     0     0 Exec
JPNOLMT              0     0 yes yes     0     0     0     0     0     0 Exec
PK5                  0     0 yes yes     0     0     0     0     0     0 Exec
項目説明
Queueキュー名
Max同時実行可能な最大ジョブ数
Totキューに投入されたすべてのジョブ数
Enaジョブが利用可能か否か
Strキューに投入されたジョブを実行させるか否か
Que同時実行数が何らかの制限値を超えたため、待機の状態にあるジョブ数
Run実行中のジョブ数
Hld何らかの理由により実行が保留された状態のジョブ数
Wat予約されたジョブなど、指定された時間となるまで待機の状態にあるジョブ数
Trn移行状態のジョブ数
Ext終了状態のジョブ数
Typeキューのタイプ

キューに関するqstatコマンドの主なオプション

オプション
機能
-Q
キューに設定された情報およびキューの状態を表示します。
-q
キューに設定された情報およびキューの状態を表示します。
(-Q とは表示される情報が一部異なります。)
-Qf Queue
指定したキューの最も詳細な情報を表示します。なお f は full を意味します。

qstatコマンド出力サンプル

qstat コマンドはジョブおよびキューの状況を確認するためのいくつかのオプションが用意されています。以下では、その利用例をご紹介します。

qstat -a

-a オプションを付加することで、qstat よりも詳しい情報を表示します。

% qstat -a

fe3: 
                                                            Req'd  Req'd   Elap
Job ID          Username Queue    Jobname    SessID NDS TSK Memory Time  S Time
--------------- -------- -------- ---------- ------ --- --- ------ ----- - -----
110.fe3         fukumoto JP10     G09_Check   18829   1   8   12gb 8760: R 00:02
111.fe3         fukumoto JP4      test463      8121   1   4   12gb 8760: R 00:01
112.fe3         fukumoto UV16     test        45502   1  16   12gb 8760: R 00:00

fe3: ジョブを管理しているサーバ名です。ジョブを投入した計算サーバとは異なります。
Job ID: PBSによって割り振られるジョブ番号。番号の後に、ジョブを管理しているサーバ名(fe3)がつきます。
Username: ジョブを投入したユーザ名
Queue: 実行中・実行予定のキュー名
Jobname: ジョブ名(#PBS -N で指定した名前)
SessID: セッションID
NDS:ジョブが要求しているノード数(select= で指定した数)
TSK:ジョブが要求しているCPUの数
Req'd Memory: ジョブが要求しているメモリサイズ
Req'd Time: ジョブが要求している経過時間(時:分)
S: ジョブの状態
Elap Time: 実際の経過時間(時:分)

 

qstat -Qf

あるキューに対する詳細な情報を参照したい場合には、オプション -Qf を指定します。 以下は SMALLキューに対する詳細な情報を表示しています。

% qstat -Qf JP4
Queue: JP4
    queue_type = Execution
    Priority = 200
    total_jobs = 1
    state_count = Transit:0 Queued:0 Held:0 Waiting:0 Running:1 Exiting:0 Begun
        :0 
    resources_max.mem = 48gb
    resources_max.ncpus = 4
    resources_default.mem = 12gb
    resources_default.ncpus = 1
    resources_default.nice = 5
    resources_default.vmem = 36gb
    resources_default.walltime = 8760:00:00
    default_chunk.Qlist = JP4
    resources_assigned.mem = 12gb
    resources_assigned.ncpus = 4
    resources_assigned.nodect = 1
    resources_assigned.vmem = 36gb
    max_run = [o:PBS_ALL=100]
    max_run_soft = [u:PBS_GENERIC=20]
    enabled = True
    started = True
  

※上記は実際とは制限値が異なる場合があります。実際に上記コマンドを実行し、最新の値を確認してください。