15 | 15 |
deleted file mode 100644 |
... | ... |
@@ -1,241 +0,0 @@ |
1 |
-title: 'Intel VTune Amplifier' |
|
2 |
-taxonomy: |
|
3 |
- category: |
|
4 |
- - docs |
|
5 |
-external_links: |
|
6 |
- process: true |
|
7 |
- no_follow: true |
|
8 |
- target: _blank |
|
9 |
- mode: active |
|
10 |
- |
|
11 |
-[toc] |
|
12 |
- |
|
13 |
-## 利用環境{#enviroment} |
|
14 |
- |
|
15 |
- |
|
16 |
- |
|
17 |
-### 利用できるバージョン・システム{#version} |
|
18 |
- |
|
19 |
-バージョン | システムA | システムB | システムC |
|
20 |
-VTune Amplifier XE 2022 (default) | ― | + | + |
|
21 |
- |
|
22 |
- |
|
23 |
- |
|
24 |
- |
|
25 |
-\+ : 利用可能 |
|
26 |
-― : 利用不可 |
|
27 |
- |
|
28 |
- |
|
29 |
-### 環境設定{#modules} |
|
30 |
- |
|
31 |
-バージョン | moduleファイル名 |
|
32 |
- 2022 | iutils/xe2022 |
|
33 |
- |
|
34 |
- |
|
35 |
- |
|
36 |
- |
|
37 |
-[Intelコンパイラ](/compilers/intel) が利用できる状態で、以下のようにmoduleコマンドを実行してください。 |
|
38 |
- |
|
39 |
- |
|
40 |
-```nohighlight |
|
41 |
-$ module load iutils |
|
42 |
-``` |
|
43 |
- |
|
44 |
- |
|
45 |
-moduleコマンドの詳細は [Modules](/config/modules) をご覧ください。 |
|
46 |
- |
|
47 |
- |
|
48 |
-## 利用方法{#usage} |
|
49 |
- |
|
50 |
- |
|
51 |
- |
|
52 |
-### コマンド{#command} |
|
53 |
- |
|
54 |
-#### 2020以降 |
|
55 |
- |
|
56 |
-コマンド | 説明 |
|
57 |
- vtune-gui | GUI版のVTune Amplifierを起動します。 |
|
58 |
- vtune | コマンドライン版のVTune Amplifierを起動します。 |
|
59 |
- |
|
60 |
- |
|
61 |
-#### 2019以前 |
|
62 |
- |
|
63 |
-コマンド | 説明 |
|
64 |
-amplxe-gui | GUI版のVTune Amplifierを起動します。 |
|
65 |
-amplxe-cl | コマンドライン版のVTune Amplifierを起動します。 |
|
66 |
- |
|
67 |
- |
|
68 |
-### オプション{#option} |
|
69 |
- |
|
70 |
- |
|
71 |
-#### amplxe-cl の主なオプション |
|
72 |
- |
|
73 |
-オプション | 説明 |
|
74 |
- -collect=_string_ | 分析を行うタイプを指定します。 |
|
75 |
- -app-working-dir=_string_ | ワーキングディレクトリを指定します。 |
|
76 |
- -r, -result-dir=_string_ | 結果を保存するディレクトリを指定します。 |
|
77 |
- |
|
78 |
- |
|
79 |
-#### amplxe-clの-collectで指定可能な主なタイプ |
|
80 |
- |
|
81 |
-タイプ | 説明 |
|
82 |
- concurrency | マルチスレッドの並列性を表示します。 |
|
83 |
- hotspots | ホットスポットを分析します。 |
|
84 |
- lightweight-hotspots | ホットスポットを高速に分析します。 |
|
85 |
- locksandwaits | ロックとウェイトを分析します。 |
|
86 |
- snb_memory-access | Sandy Bridgeでメモリアクセスを分析します。 |
|
87 |
- |
|
88 |
- |
|
89 |
-## 利用例{#sample} |
|
90 |
- |
|
91 |
- |
|
92 |
- |
|
93 |
-### GUIでの利用例{#sample_gui} |
|
94 |
- |
|
95 |
- |
|
96 |
-1. コンパイル |
|
97 |
-Intel VTune Amplifierを使用する場合、デバッグオプション **-g -O2** を指定してコンパイルを行ってください。コンパイルオプションについては [こちら](http://software.intel.com/en-us/articles/compiler-switches-for-intel-vtune-amplifier-xe-for-linux/)も参考にしてください。 |
|
98 |
- |
|
99 |
- ```nohighlight |
|
100 |
- $ icc -g -O2 test.c |
|
101 |
- ``` |
|
102 |
- |
|
103 |
-2. VTune Amplifier の起動 |
|
104 |
-[Exceed onDemand](/login/eod) で、 **amplxe-gui** コマンドを実行するとVTune Amplifierが起動します。 **xrun** コマンドの詳細は [会話型処理](/run/interactive) をご覧ください。 |
|
105 |
- |
|
106 |
- ```nohighlight |
|
107 |
- $ xrun amplxe-gui |
|
108 |
- ``` |
|
109 |
- |
|
110 |
- ![](amplxe01.png) |
|
111 |
-3. プロジェクトを作成する |
|
112 |
-**File** => **New** => **Project** を選択すると以下のような画面が表示されますので、適切な **Project name** を入力して、 **Create Project** を押してください。 |
|
113 |
- |
|
114 |
- ![](amplxe02.png) |
|
115 |
- |
|
116 |
-4. プロジェクトの設定 |
|
117 |
-続いて、Project Properties の画面が表示されますので、対象とするプログラムを **Application** で指定して **OK** を押してください。引数等が必要な場合はここで指定します。 |
|
118 |
- |
|
119 |
- ![](amplxe03.png) |
|
120 |
- |
|
121 |
-5. 新しい分析の設定 |
|
122 |
-プロジェクトのプロパティ設定が完了すると、下図の画面に戻りますので 三角マークの **New Analysis** を押してください。 |
|
123 |
- |
|
124 |
- ![](amplxe04.png) |
|
125 |
- |
|
126 |
-5. 分析開始 |
|
127 |
-Choose Analysis Type の画面が表示されますので、チェックの対象を指定した上で、 **Start** |
|
128 |
-を押してください。 |
|
129 |
- |
|
130 |
- ![](amplxe05.png) |
|
131 |
- |
|
132 |
-6. 分析結果の確認 |
|
133 |
-しばらく待つと、VTune Amplifierでの分析結果が表示されます。この例では、grid_intersect関数がCPU時間を多く使用していることが分かります。 |
|
134 |
- |
|
135 |
- ![](amplxe06.png) |
|
136 |
- |
|
137 |
- |
|
138 |
-#### OpenMPプログラムの解析 |
|
139 |
- |
|
140 |
-GUI版はOpenMPプログラムの解析に対応しています。 |
|
141 |
-xrun コマンドで起動時に、-A オプションでスレッド数を指定します。 |
|
142 |
- |
|
143 |
-例:8スレッド実行 |
|
144 |
-```nohighlight |
|
145 |
-xrun -A t=8:c=8 amplxe-gui |
|
146 |
-``` |
|
147 |
- |
|
148 |
-VTuneの起動後、「Advanced Hotspots」を選び、「Analyze OpenMP Regions」を選択して「Start」を押せば、スレッド8並列での解析が行われます。 |
|
149 |
- |
|
150 |
-![](amplxe07.png) |
|
151 |
- |
|
152 |
-なお、MPIプログラムの解析は、CUI版をご利用ください。 |
|
153 |
- |
|
154 |
-### CUIでの利用例{#sample_cui} |
|
155 |
- |
|
156 |
-1. コンパイル |
|
157 |
-Intel VTune Ampliferを使用する場合、デバッグオプション **-g -O2** を指定してコンパイルを行ってください。コンパイルオプションについては [こちら](http://software.intel.com/en-us/articles/compiler-switches-for-intel-vtune-amplifier-xe-for-linux/)も参考にしてください。 |
|
158 |
- |
|
159 |
- ```nohighlight |
|
160 |
- $ icc -g -O2 test.c |
|
161 |
- ``` |
|
162 |
- |
|
163 |
-2. チェックの実行 |
|
164 |
-CUI版のVTune Amplifierは **amplxe-cl** コマンドで利用できます。この例では、結果を出力するディレクトリの指定して、hotspotsの分析をしています。 **tssrun** コマンドの詳細は [会話型処理](/run/interactive) をご覧ください。 |
|
165 |
- |
|
166 |
- ```nohighlight |
|
167 |
- $ tssrun amplxe-cl -collect hotspots -r=./result ./a.out |
|
168 |
- Parser returned a non-zero error code reading dat/balls.dat |
|
169 |
- Aborting Render... |
|
170 |
- Using result path `/home/b/b59999/intel/amplxe/samples/tachyon/result' |
|
171 |
- Executing actions 75 % Generating a report |
|
172 |
- Summary |
|
173 |
- ------- |
|
174 |
- |
|
175 |
- Elapsed Time: 0.101 |
|
176 |
- CPU Time: 0 |
|
177 |
- Executing actions 100 % done |
|
178 |
- ``` |
|
179 |
- |
|
180 |
-3. 結果の確認 |
|
181 |
-[Exceed onDemand](/login/eod) など X(GUI)が利用できる環境で、 **amplxe-gui** コマンドを実行し、GUI版のVTune Amplifierで結果を確認してください。 **xrun** コマンドの詳細は [会話型処理](/run/interactive) をご覧ください。 |
|
182 |
- |
|
183 |
- ```nohighlight |
|
184 |
- $ xrun amplxe-gui ./result/result.amplxe |
|
185 |
- ``` |
|
186 |
- |
|
187 |
- ![](amplxe06.png) |
|
188 |
- |
|
189 |
-#### 並列プログラムの解析{#parallel} |
|
190 |
- |
|
191 |
-CUI版はMPIおよびOpenMPプログラムの解析に対応しています。 |
|
192 |
-tssrunでVTuneを実行の際、-A オプションで並列数を指定します。 |
|
193 |
-また、mpiexec.hydra の付加が必要です。 |
|
194 |
- |
|
195 |
-例:MPI4並列で解析 |
|
196 |
- |
|
197 |
-```nohighlight |
|
198 |
-$ tssrun -A p=4 mpiexec.hydra amplxe-cl -collect hotspots -r=./result ./a.out |
|
199 |
-qsub: waiting for job 1258261.jb to start |
|
200 |
-qsub: job 1258261.jb ready |
|
201 |
- |
|
202 |
-amplxe: Analyzing data in the node-wide mode. The hostname (nb-0041) will be added to the result path/name. |
|
203 |
-amplxe: Collection started. |
|
204 |
-Hello world from processor nb-0041, rank 2 out of 4 processors |
|
205 |
-Hello world from processor nb-0041, rank 3 out of 4 processors |
|
206 |
-Hello world from processor nb-0041, rank 0 out of 4 processors |
|
207 |
-Hello world from processor nb-0041, rank 1 out of 4 processors |
|
208 |
-amplxe: Collection stopped. |
|
209 |
-amplxe: Using result path `/home0/w/w00001/mpitest/b/result.nb-0041' |
|
210 |
-amplxe: Executing actions 19 % Resolving information for `libtmip_psm2.so' |
|
211 |
-amplxe: Warning: Cannot locate debugging symbols for file `/opt/app/intel/impi/2017.2.174/intel64/lib/libtmip_psm2.so'. |
|
212 |
-amplxe: Executing actions 75 % Generating a report |
|
213 |
-amplxe: Executing actions 100 % done |
|
214 |
- |
|
215 |
-Collection start time 07:23:49 19/12/2017 UTC |
|
216 |
-Collection stop time 07:23:50 19/12/2017 UTC |
|
217 |
- |
|
218 |
-Summary |
|
219 |
-Elapsed Time: 0.553 |
|
220 |
-Paused Time: 0.0 |
|
221 |
-CPU Time: 0.310 |
|
222 |
-Average CPU Usage: 0.435 |
|
223 |
- |
|
224 |
-qsub: job 1258261.jb completed |
|
225 |
-``` |
|
226 |
- |
|
227 |
- |
|
228 |
-## マニュアル{#manual} |
|
229 |
- |
|
230 |
-* [Intel VTune Amplifier XE 2016 Documentation](https://web.kudpc.kyoto-u.ac.jp/Compiler_Manual/Intel/VTune_Amplifier_XE_2016/en/documentation_amplifier.htm) |
|
231 |
-* [Intel VTune Amplifier XE 2018 Help](https://web.kudpc.kyoto-u.ac.jp/Compiler_Manual/Intel/VTune_Amplifier_XE_2018/index.htm) |
|
232 |
-* [Intel® VTune™ Amplifier 2019 User Guide](https://web.kudpc.kyoto-u.ac.jp/Compiler_Manual/Intel/intel_parallel_studio_xe_2019_3/en/vtune_amplifier/help/index.htm) |