--- title: 'Information for Group Managers' taxonomy: category: - docs --- [toc] ## What Is Group Manager?{#introduction} A group manager is a person authorized to manage group course or private cluster course. By default, the group manager is set to the service course applicant. The applicant of the service course can add/change the group manager. Please apply for add/change via [User Portal](https://web.kudpc.kyoto-u.ac.jp/portal/). A group manager can use the commands for managing the group. The dedicated commands of group manager allow group managers to manage queues and disks allocated to their groups and group members. <!-- ## グループ管理者の確認(group_managers){#group_managers} **group_managers** コマンドで、現在のグループ管理者を確認できます。 ```nohighlight $ group_managers Group: gr19999, Managers: a59990,a59992 ``` --> ## Managing Group Members {#group_members} Group members can check or add/delete members by logging into the [User Portal](https://web.kudpc.kyoto-u.ac.jp/portal). <!-- **group_members** コマンドで、グループメンバーの表示、追加ができます。メンバーはグループ専用キューへのジョブ投入やLARGEディスクスペースを利用することができます。 **グループメンバーの表示** ```nohighlight $ group_members -g gr19999 -l gr19999:a59990,a59991,a59992,a59993,a59994 ``` **グループメンバーの削除** ```nohighlight $ group_members -g gr19999 -d b59999 deleting user b59999 from group gr19999 ``` **グループメンバーの追加** ```nohighlight $ group_members -g gr19999 -a b59999 adding user b59999 to group gr19999 ``` * サービスコースの支払責任者配下の利用者は、自動的にグループのメンバーとして登録されています。 * このコマンドで追加したメンバーは、グループ用キューへのジョブ投入やLARGEディスクスペースを利用することができます。 * group_members コマンドでユーザの追加削除を行う場合は、-g オプションでグループ名を指定してください。指定しない場合、操作者のカレントグループが適用されます。そのため、カレントグループが操作者の利用者IDとなっていた場合、ご希望のグループではなく、当該利用者IDのグループにユーザが追加されてしまいます。 #### グループに追加したメンバーのキュー利用に関する注意 グループメンバーを新規追加しても、そのメンバーがグループ用キューを即座に利用できるようになるわけではありません。追加されたメンバーがキューにジョブを投入するためには、ジョブスケジューラシステムに設定変更が反映される必要があります。反映は設定変更の翌朝に行われます。お急ぎの場合は、プログラミング相談室 までご連絡ください。 #### グループメンバーと負担金請求先について グループコースの無料の利用者追加枠の対象は、グループコースの支払責任者との予算による紐づきで判定します。無料の対象とするためには、利用申請書の提出が必要です。 group_members コマンドまたは利用者ポータルでグループメンバーを追加しただけでは対象となりませんので、ご注意ください。 --> ## Backing Up LARGE Disk Space (group_backup){#group_backup} You can make backup settings of the LARGE disk space by using the **group_backup** command. LARGE disk space consists of the _/LARGE0/groupname_ directory and the _/LARGE1/groupname_ directory, and you can set one of the following status. Status | /LARGE0/groupname | /LARGE1/groupname :----------:|:------------------:|:-------------------: Backup | Safe(Make backup) | Backup (Backup location) Not Backup | Unsafe(Not make backup) | Unsafe(Not make backup) Of these, disks whose settings are Safe or Unsafe can be used. **Checking the backup settings** The target group can be specified with the -g option. If omitted, the current group when the command is executed is targeted. ```nohighlight $ group_backup -g gr19999 -l Num Filesystem Status Filesystem Status 1) /LARGE0/gr19999 ... Safe /LARGE1/gr19999 ... Backup <- バックアップ使用状態 ``` **Setting the status to “Not Backup”** ```nohighlight $ group_backup -g gr19999 --unsafe 1 /LARGE0/gr19999: Safe => UnSafe /LARGE1/gr19999: Backup => UnSafe ``` **Checking the backup settings(after changes)** ```nohighlight $ group_backup -g gr19999 -l Num Filesystem Status Filesystem Status 1) /LARGE0/gr19999 ... UnSafe /LARGE1/gr19999 ... UnSafe <- バックアップ未使用状態 ``` **Return to the status to Backup** ```nohighlight $ group_backup -g gr19999 --safe 1 /LARGE0/gr19999: Unsafe => Safe /LARGE1/gr19999: Unsafe => Backup ``` ## Cleaning Up Files in LARGE Disk Space(group_trash){#group_trash} The **group_trash** command allows users to delete files(move to trash) in the LARGE disk space. It can delete the data files of users who are no longer enrolled due to graduation, etc. If you accidentally delete a file, you can recover it from the trash, but please note that the trash is emptied every Monday. **Deleting files by the group_trash command** Specify the target group with the -g option. If omitted, the group manager authority are determined by the current group when the command is executed. ```nohighlight $ group_trash -g gr19999 /LARGE0/gr19999/file1 file1 to Trash (/LARGE0/gr19999/.DpcTrash/b59999/2009-04-10_1010) ``` ## Managing Members Using Queue{#queue_members} There are two types of units of management of Slurm queue privileges: users and groups. Users are empty by default, Groups are initially registered with the group corresponding to the queue name as the default setting. If you wish to use a queue with multiple groups, or if you wish to grant queue access to a single user who does not belong to a group, please contact us using the [Inquiry Form](https://www.iimc.kyoto-u.ac.jp/ja/inquiry/?q=consult). ## Job Scheduling Policy of Queue{#queue_policy} You can select the job scheduling policy from the following three types. If you are using an individual queue (grXXXXXx), you can change your preferred scheduling policy by contacting us from the applicant at [Inquiry Form](https://www.iimc.kyoto-u.ac.jp/ja/inquiry/?q=consult). (We cannot accept requests for shared queues such as entry course or personal course.) Settings | Operation :-------:|------ pass | If there are sufficient computing resources to execute a job, it will overtake jobs waiting to be executed that are in line before it.<br>You can use computing resources efficiently, but large jobs may not be executed indefinitely.**【Default Value】** wait | It will not overtake jobs even if there is a enough computing resources. backfill | Based on the calculations of the execution time limit (-t) of each job, it will overtake jobs only if it does not affect the execution start time of other jobs. For example, you can use resources effectively by executing small jobs that can complete execution before a large job is started. <!-- ## キュー利用メンバーの管理(queue_acl_users, queue_acl_groups){#queue_members} **queue_acl_users** コマンドおよび**queue_acl_groups**コマンドで、キュー利用メンバーの表示、追加、削除ができます。登録されているメンバーはキューへジョブを投入することができます。 PBSの権限の管理の単位として、acl_usersとacl_groupsの2種類があります。acl_usersは初期設定では空にしており、acl_groupsには初期設定としてキュー名に対応するグループが最初から登録されています。 複数のグループでキューを利用する場合は queue_acl_groups コマンドでグループを追加してください。ユーザ個別に追加する場合も、ユーザ名と同名のグループを追加することで対応可能です。 複雑な制御として、特定のグループの特定のユーザのみに利用権限を付与したい場合は、acl_groupsだけでなく、acl_users にユーザを追加することで、両方の条件を満たす方のみがジョブ投入できるように制御可能です。 **キュー利用メンバーの表示(acl_groups)** ```nohighlight $ queue_acl_groups -q gr19999a -l Request: acl_groups: gr19999 PBS : acl_groups: gr19999 ``` **キュー利用メンバーの追加(acl_groups)** ```nohighlight $ queue_acl_groups -q gr19999a -a gr19999 ``` **キュー利用メンバーの削除(acl_groups)** ```nohighlight $ queue_acl_groups -q gr19999a -d gr19999 ``` * どの操作についても、-qオプションによるキューの指定が必須となります。 * メンバーの追加や削除は、設定変更の翌日の朝にジョブスケジューラシステムに反映されます。(将来的に1時間に1回程度に改善する予定です) ## キュー利用メンバーの管理(queue_members){#queue_members} **queue_members** コマンドで、キュー利用メンバーの表示、追加、削除ができます。登録されているメンバーはキューへジョブを投入することができます。なお、グループコースキューには、初期設定として当該グループが最初から登録されています。 **キュー利用メンバーの表示** ```nohighlight $ queue_members -q gr19999a -l gr19999 w12345 ``` **キュー利用メンバーの追加** ```nohighlight $ queue_members -q gr19999a -a b67890 ``` **キュー利用メンバーの削除** ```nohighlight $ queue_members -q gr19999a -d w12345 ``` * どの操作についても、-qオプションによるキューの指定が必須となります。 * メンバーの追加や削除は、設定変更の翌日の朝にジョブスケジューラシステムに反映されます。 ## キューのジョブスケジューリングポリシー設定(queue_policy){#queue_policy} [オンライン相談室](http://www.iimc.kyoto-u.ac.jp/ja/services/comp/contact.html#consult)にメールで依頼いただくことで、キューのジョブスケジューリングについてのポリシー設定ができます。キューに投入されたジョブの実行順序を決めるポリシー(SCHEDULING_POLICY)と、実行順序が自分より早いジョブを追い越して実行してもよいかを設定するポリシー(PASSING_POLICY)の2種類について設定が可能です。 * SCHEDULING_POLICY 設定値 | 動作 :-----------:|:-------------------------------------------------------------------------: fcfs | キューに投入された順番でジョブを実行する先着順スケジューリング(First-Come, First-Served)。初期設定値。 fairshare | ユーザ間でリソースを公平に使用できるように動的優先順位を内部で計算し、優先順位の高いユーザのジョブから順に実行するフェアシェアスケジューリング。 * PASSING_POLICY 設定値 | 動作 :----------:|:------: pass | あるジョブを実行するのに十分な計算資源がある場合、そのジョブよりも前に並んでいる実行待ちジョブを追い越して実行する。効率的に計算資源を利用できるが、大規模なジョブがいつまでも実行されない可能性が生じる。初期設定値。 wait | 計算資源に空きがある場合でも、ジョブ間の追越しは発生しない。 backfill | 各ジョブの実行時間制限(-W)をもとに計算を行い、他のジョブの実行開始時刻に影響を及ぼさない場合のみ、追越しが発生する。たとえば、大規模ジョブが開始されるまでの間に実行を完了できる小さなジョブを走らせることで資源を有効活用できる。 --> ## Confirmation of job execution status and cancellation of the queue(spadmin){#spadmin} You can confirm the job execution status of queues registered as a group manager and cancel the jobs with the **spadmin** command. * Confirmation of job execution status ```nohighlight $ spadmin list -p gr19999b ## Please change the "gr19999b" part to the queue name you wish to confirm. JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 4781 gr19999b run_cpu2 b59999 R 1:26:09 1 nb0001 ``` * Cancellation of the job ```nohighlight $ spadmin cancel 123 scancel: Terminating job 123 ``` If anyone other than the group manager execute the **spadmin** command, the following error message will be displayed. ```nohighlight $ spadmin list -p gr19999g Authorization Failure ```