会話型処理(GPUサーバ)

スーパーコンピュータの可視化環境の改善を目的として,2018年12月より試験的に提供を始めたものです.
京都大学 学術情報メディアセンターが提供するGPUサーバは,システムB/Cの環境に準拠して構築しており, システムB/Cからご利用いただく想定となっています.
システムAからもご利用頂くことは可能となっていますが,利用できるアプリケーションはシステムB/Cで 利用可能なものに限られ,システムAでコンパイルされた一部のアプリケーションについては動作しないなどの 問題が発生する恐れがございますので,予めご了承下さい.

京都大学 学術情報メディアセンターが提供するGPUサーバは下記のとおりです.

性能諸元  
CPU Intel(R) Xeon(R) Gold 6140 2.30GHz (18コア) x 2
メモリ 512GB
搭載GPU NVIDIA Quadro P4000 (8 GB GDDR5) x 2

性能諸元  
CPU Intel(R) Xeon(R) Silver 4110 2.10GHz (8コア) x 2
メモリ 512GB
搭載GPU NVIDIA Quadro GV100 (32 GB HBM2) x 2

GPUサーバは,システムA,B,Cのログインノードから利用することが可能です. システムへの接続方法 を参考にログインノードへログインしてください.
GPUサーバを利用するにあたっての申請は特になく,スパコンユーザであればどなたでもご利用頂けます.

GPUサーバを用いてアプリケーションを実行する際には,ログインノードにログインし,xrunコマンドを用いて実行する必要があります.
xrun コマンドに -gpu オプションおよび実行したいコマンドを指定することで,GPUサーバでプログラムが実行することができます.

コマンド 説明 備考
xrun -gpu GPUサーバでGUIプログラムを実行する Exceed onDemand 等のXサーバソフトウェアでのみ利用可能.
  • システム全体に関する注意事項
    • コマンドを入力すると,いくつかのメッセージが表示された後,プログラムの実行が開始されます.
    • 通常の xrun (-gpu無し)の場合と異なり,GPUサーバでのプログラム起動前に新規ログインと同様の処理が実施されます.このため,$HOME/.bash_profile, .bashrc, .tcshrc等が改めて評価される点にご注意ください. また,モジュール環境についても再設定されるため,コマンド実行時の環境変数が正確に再現されない点にご注意ください.PATHやLD_LIBRARY_PATHの順序や定義状況に差が出る場合があります.
    • GPUサーバの受け入れ上限値を超えると,混雑している旨を表示しプログラムが終了します.時間を空けて再度お試しください.

$ module load mathematica
$ xrun -gpu mathematica
[VGL] NOTICE: Automatically setting VGL_CLIENT environment variable to
[VGL]    10.11.0.9, the IP address of your SSH client.
(Xアプリケーションが起動する)

コマンド 説明 備考
xrun -gpu -module ModuleName GPUサーバでGUIプログラムを実行する Exceed onDemand 等のXサーバソフトウェアでのみ利用可能.
  • システムAに関する注意事項
    • GPUサーバは,システムB/Cに準拠して構築されているため,システムAからの利用については 試験的な提供となります.
    • コマンドを入力すると,いくつかのメッセージが表示された後,プログラムの実行が開始されます.
    • ログインノードで設定した環境変数やロード済みのモジュール環境は,GPUサーバに引き継がれませんのでご注意ください.
    • プログラムの実行時には,-module オプションを用いて,読み込むモジュールを指定する必要があります. このときに指定するモジュール名は,システムB/C で利用可能なモジュール名となりますのでご注意ください.
  • システム全体に関する注意事項
    • 通常の xrun (-gpu無し)の場合と異なり,GPUサーバでのプログラム起動前に新規ログインと同様の処理が実施されます.このため,$HOME/.bash_profile, .bashrc, .tcshrc等が改めて評価される点にご注意ください.また,モジュール環境についても再設定されるため,コマンド実行時の環境変数が正確に再現されない点にご注意ください.PATHやLD_LIBRARY_PATHの順序や定義状況に差が出る場合があります.
    • GPUサーバの受け入れ上限値を超えると,混雑している旨を表示しプログラムが終了します.時間を空けて再度お試しください.

$ xrun -gpu -module mathematica mathematica
[VGL] NOTICE: Automatically setting VGL_CLIENT environment variable to
[VGL]    10.11.0.11, the IP address of your SSH client.
(Xアプリケーションが起動する)

GPUサーバを用いてプログラムを実行する際に,xrunコマンドで利用可能なオプションは以下のとおりです.

オプション  要否  説明
-gpu 必須 GPUサーバを利用してプログラムを実行するための宣言
-module ModuleName 任意(システムA)
利用不可(システムB/C)
システムAからGPUサーバを利用してプログラムを実行する際に,システムB/C用のモジュールを指定する必要がある.
-W HOUR:MINUTES 任意 経過時間上限値の指定(単位は時:分)
経過時間の標準は1時間(1:00)となっており,最長24時間(24:00)まで指定可能.

GPUサーバを用いてプログラムを実行する際には,以下のような制限が適用されます.

  • ノードの共有
    GPUサーバは,現在1台のノードにて構成されています.
    契約しているコースに関係なく,すべてのユーザがノードを共有して利用する形態となっており, GPUサーバの受け入れ上限値を超えると,混雑している旨を表示しプログラムが終了します.

  • 利用できるCPUコア数
    1ユーザが同時に利用できるCPUコア数は,4コア となっており変更することはできません.

  • 利用できるメモリ量
    1ユーザが同時に利用できるメモリ量は,64GB です.予約システムを用いることで,480GB まで上限を拡張することが出来ます.

  • プログラムの経過時間制限
    GPUサーバを用いてプログラムを実行する場合,経過時間が標準の制限(1時間)を超えるとプログラムは強制終了されます.
    -W オプションを指定することで時間を上限(24時間)まで増やすことができます.また,予約システムを用いることで, 72時間 まで上限を拡張することが可能です.

2019年12月より,GPUサーバの「予約」サービスを開始しています. 「予約」を行うことで,以下の通りGPUサーバの利用条件を拡大することが可能です.

  予約なし 予約あり
利用できるメモリ量 64GB(固定) 最大480GB ※予約時に30GB単位で指定が可能
最大実行時間 24時間 72時間(3日間)
GPUボードの専有利用 なし あり(24時間経過後から予約可能)

※ 予約を行うことによって拡張される利用条件は 2020年4月28日 現在のものです.今後の利用状況によって変更することがありますので予めご承知おきください.

  1. 利用者ポータル にログインします.

  2. 「サービス申請」を押下し,「可視化サーバ予約」を選択します.

  3. 「利用する可視化サーバ」ならびに,予約するメモリ量,GPUの利用種別を選択し,「次へ」を押下します.

  4. 利用可能な日程一覧が表示されますので,開始時刻と終了時刻を選択してください.

  5. 青く塗りつぶされた予約期間が正しいことを確認して,下部の「予約確定」を押下します.

  6. 下記の画面に遷移すると予約完了となります.予約開始時間になりましたら利用の流れを参考にプログラムを実行して下さい.


Copyright © Academic Center for Computing and Media Studies, Kyoto University, All Rights Reserved.