--- title: 会話型処理(GPUサーバ) media_order: 'reserve_index.png,reserve_index_complete.png,reserve_index2.png,reserve_list.png,reserve_list_complete.png,login.png' published: true taxonomy: category: - docs external_links: process: true no_follow: true target: _blank mode: active --- [toc] ## GPUサーバについて スーパーコンピュータの可視化環境の改善を目的として,2018年12月より試験的に提供を始めたものです.<br> 京都大学 学術情報メディアセンターが提供するGPUサーバは,システムB/Cの環境に準拠して構築しており, システムB/Cからご利用いただく想定となっています.<br> システムAからもご利用頂くことは可能となっていますが,利用できるアプリケーションはシステムB/Cで 利用可能なものに限られ,システムAでコンパイルされた一部のアプリケーションについては動作しないなどの 問題が発生する恐れがございますので,予めご了承下さい. ### システム構成 京都大学 学術情報メディアセンターが提供するGPUサーバは下記のとおりです. #### GPUノード 1 (gp-0001) 性能諸元 |   :-------------------:|:----------------------------------------------------------------: CPU | Intel(R) Xeon(R) Gold 6140 2.30GHz (18コア) x 2 メモリ | 512GB 搭載GPU | NVIDIA Quadro P4000 (8 GB GDDR5) x 2 #### GPUノード 2 (gp-0002) 性能諸元 |   :-------------------:|:----------------------------------------------------------------: CPU | Intel(R) Xeon(R) Silver 4110 2.10GHz (8コア) x 2 メモリ | 512GB 搭載GPU | NVIDIA Quadro GV100 (32 GB HBM2) x 2 ## 利用の流れ{#howtouse} GPUサーバは,システムA,B,Cのログインノードから利用することが可能です. [システムへの接続方法](https://web.kudpc.kyoto-u.ac.jp/manual/ja/login#flow) を参考にログインノードへログインしてください.<br> GPUサーバを利用するにあたっての申請は特になく,スパコンユーザであればどなたでもご利用頂けます. ## GPUサーバでアプリケーションを実行するためのコマンド GPUサーバを用いてアプリケーションを実行する際には,ログインノードにログインし,xrunコマンドを用いて実行する必要があります.<br> xrun コマンドに -gpu オプションおよび実行したいコマンドを指定することで,GPUサーバでプログラムが実行することができます.<br> ### システムB/C で利用する場合 コマンド | 説明 | 備考 :-----------:|:----------------------------------------------:|:-----------------------------------------------------------------------:| xrun -gpu | GPUサーバでGUIプログラムを実行する| [Exceed onDemand](https://web.kudpc.kyoto-u.ac.jp/grav-draft/ja/login/eod) 等のXサーバソフトウェアでのみ利用可能. * システム全体に関する注意事項 * コマンドを入力すると,いくつかのメッセージが表示された後,プログラムの実行が開始されます. * 通常の xrun (-gpu無し)の場合と異なり,GPUサーバでのプログラム起動前に新規ログインと同様の処理が実施されます.このため,$HOME/.bash_profile, .bashrc, .tcshrc等が改めて評価される点にご注意ください. また,モジュール環境についても再設定されるため,コマンド実行時の環境変数が正確に再現されない点にご注意ください.PATHやLD_LIBRARY_PATHの順序や定義状況に差が出る場合があります. * GPUサーバの受け入れ上限値を超えると,混雑している旨を表示しプログラムが終了します.時間を空けて再度お試しください. #### 実行例 ```nohighlight $ module load mathematica $ xrun -gpu mathematica [VGL] NOTICE: Automatically setting VGL_CLIENT environment variable to [VGL] 10.11.0.9, the IP address of your SSH client. (Xアプリケーションが起動する) ``` ### システムA で利用する場合 コマンド | 説明 | 備考 :-----------:|:----------------------------------------------:|:-------------------:|:-----------------------------------------------------------------------:| xrun -gpu -module ModuleName | GPUサーバでGUIプログラムを実行する | [Exceed onDemand](https://web.kudpc.kyoto-u.ac.jp/grav-draft/ja/login/eod) 等のXサーバソフトウェアでのみ利用可能. * システムAに関する注意事項 * GPUサーバは,システムB/Cに準拠して構築されているため,システムAからの利用については **試験的な提供**となります. * コマンドを入力すると,いくつかのメッセージが表示された後,プログラムの実行が開始されます. * ログインノードで設定した環境変数やロード済みのモジュール環境は,GPUサーバに**引き継がれません**のでご注意ください. * プログラムの実行時には,-module オプションを用いて,読み込むモジュールを指定する必要があります. このときに指定するモジュール名は,**システムB/C で利用可能なモジュール名**となりますのでご注意ください. * システム全体に関する注意事項 * 通常の xrun (-gpu無し)の場合と異なり,GPUサーバでのプログラム起動前に新規ログインと同様の処理が実施されます.このため,$HOME/.bash_profile, .bashrc, .tcshrc等が改めて評価される点にご注意ください.また,モジュール環境についても再設定されるため,コマンド実行時の環境変数が正確に再現されない点にご注意ください.PATHやLD_LIBRARY_PATHの順序や定義状況に差が出る場合があります. * GPUサーバの受け入れ上限値を超えると,混雑している旨を表示しプログラムが終了します.時間を空けて再度お試しください. #### 実行例 ```nohighlight $ xrun -gpu -module mathematica mathematica [VGL] NOTICE: Automatically setting VGL_CLIENT environment variable to [VGL] 10.11.0.11, the IP address of your SSH client. (Xアプリケーションが起動する) ``` ### コマンドオプション GPUサーバを用いてプログラムを実行する際に,xrunコマンドで利用可能なオプションは以下のとおりです. オプション |  要否  | 説明 :-----------------------------:|:---------------------------:|:-------------------------------------------------: -gpu | 必須 |GPUサーバを利用してプログラムを実行するための宣言 -module ModuleName | 任意(**システムA**)<br>利用不可(**システムB/C**) | システムAからGPUサーバを利用してプログラムを実行する際に,**システムB/C用のモジュールを指定**する必要がある. -W HOUR:MINUTES | 任意 |経過時間上限値の指定(単位は時:分)<br>経過時間の標準は1時間(1:00)となっており,最長24時間(24:00)まで指定可能. ## GPUサーバを用いてプログラムを実行する際の制限 GPUサーバを用いてプログラムを実行する際には,以下のような制限が適用されます.<br> * ノードの共有<br> GPUサーバは,現在1台のノードにて構成されています.<br> 契約しているコースに関係なく,すべてのユーザがノードを共有して利用する形態となっており, GPUサーバの受け入れ上限値を超えると,混雑している旨を表示しプログラムが終了します.<br> * 利用できるCPUコア数<br> 1ユーザが同時に利用できるCPUコア数は,**4コア** となっており変更することはできません.<br> * 利用できるメモリ量<br> 1ユーザが同時に利用できるメモリ量は,**64GB** です.予約システムを用いることで,**480GB** まで上限を拡張することが出来ます.<br> * プログラムの経過時間制限<br> GPUサーバを用いてプログラムを実行する場合,経過時間が標準の制限(1時間)を超えるとプログラムは強制終了されます.<br> -W オプションを指定することで時間を上限(24時間)まで増やすことができます.また,予約システムを用いることで, **72時間** まで上限を拡張することが可能です. ## GPUサーバの利用予約について{#reservation} 2019年12月より,GPUサーバの「予約」サービスを開始しています. 「予約」を行うことで,以下の通りGPUサーバの利用条件を拡大することが可能です.  | 予約なし | 予約あり :-----------------:|:-----------------------:|:-------------: 利用できるメモリ量 | 64GB(固定) | 最大480GB ※予約時に30GB単位で指定が可能 最大実行時間 | 24時間 | 72時間(3日間) GPUボードの専有利用 | なし | あり(24時間経過後から予約可能) ※ 予約を行うことによって拡張される利用条件は **2020年4月28日** 現在のものです.今後の利用状況によって変更することがありますので予めご承知おきください. ### 予約手順 1. [利用者ポータル](https://web.kudpc.kyoto-u.ac.jp/portal) にログインします. ![](login.png?lightbox=100%&resize=600) 2. 「サービス申請」を押下し,「可視化サーバ予約」を選択します. ![](reserve_index.png?lightbox=100%&resize=600) 3. 「利用する可視化サーバ」ならびに,予約するメモリ量,GPUの利用種別を選択し,「次へ」を押下します. ![](reserve_index2.png?lightbox=100%&resize=600) 4. 利用可能な日程一覧が表示されますので,開始時刻と終了時刻を選択してください. ![](reserve_list.png?lightbox=100%&resize=600) 5. 青く塗りつぶされた予約期間が正しいことを確認して,下部の「予約確定」を押下します. ![](reserve_list_complete.png?lightbox=100%&resize=600) 6. 下記の画面に遷移すると予約完了となります.予約開始時間になりましたら[利用の流れ](#howtouse)を参考にプログラムを実行して下さい. ![](reserve_index_complete.png?lightbox=100%&resize=600)