��돪��������¡�GPU����4��������������GPGPU\µ���¼\Ð�����ҏ��µ������������µ���²��Џ��̏����������������·�����ď�¡�
³���GPU������\���\���\������̏��������������̏�����»����������������������������������������«��¡�·¹�����Џ�����³���������·�����ď�����������»�ߏ�������������¡�Munin������plugin�����ҏ�돫����������������Ώ��������·�����ď�¡�
����叢�������������«���̏�돫��������������������������������«��¡�\��\���\��\���\��я���½���������������������������������
Munin Exchange | Munin plugin repository
������³���������·�����������Ώ�������������¡�nvidia_smi_ plugin���̏����������������·�����ď�¡�
�����ď�������¡��³�����������������ď�ԏ�����GPU�����ҏ������������������������돫�������������\��\���\��؏��������¹�����������������Ï�����������������¡�GPU����4�����������������������«���������������������������������½�����Ï��������¹��¡�
�����������������Ï��³��������������¡�¼«����̏�������돫����������������Ώ��������·�����ď�¡�
�돪�²¼���������������Ï�����\��\���\��؏��̏�돫�����µ���������������¹��¡�
���³������������
CUDA GPU memtest
�������돪�²¼�����ҏ����»��Џ�����1.5»��С���ӏ����叢����¼���¹��ԏ��·������»��Џ����������������������¹��¡�
����Test10 ������ Memory stress test ��������¡�Test8 ������ Modulo 20, random pattern����
./cuda_memtest --device 2 --disable_all --enable_test 10 --num_iterations 10000 ./cuda_memtest --device 3 --disable_all --enable_test 8 --num_iterations 10000
�����ď��\��\���\��؏�����½Ð�������¹������\��\���\��\���\��я�����돫����������������¡�돪�²¼������»²¹������������·���������·�����ď�¡�
MultigraphSampleOutput - Munin - Trac
GPU,Memory������»��������Џ�¡���¡�²¹�����㏢���� nvidia-smi \³\���\���\���������¼���������������������������¹��¡�
\��\���\��\���\��я�����\¹\���\���\��\���������������²���²��я�����¼���¹��ԏ��¹������������������¡����������я�����������������µ������̡돫⏢�ޏ�����������������¡�1²��я��������ޏ�����¼���¹��ԏ�������돪Џ����������������Ï��������·�����������Ώ��������·�����ď�¡�
�����䏪���ӏ�����³���\����¼\���������top\��⏢�¼\���������GPU\��\���\��؏�����4���������������Ģ���Џ��������¹���������������������µ���½�����Ï��������¹���̏�¡��������������������������ď�����������¡�¼�����������������GPU��ď�ԏ��������·���������������������¹��¡�
���������ޏ��������Ð��¡����������������ď��«²��Џ������·���������������������µ��������¡�
#!/bin/bash # written by Shigefumi # Munin plugin to monitor NVIDIA Tesla S2070 GPU statistics EXEC="/usr/bin/nvidia-smi" if [ ! -x ${EXEC} ]; then echo "${EXEC} not installed." exit 1 fi DATA=$(${EXEC} | egrep "%|Temperature" | \ egrep -v "Intake Temperature|Fan Speed" | \ awk '{print $3}' | sed -e 's/%//') ARRAY=($DATA) GPU_TOTAL=$((${#ARRAY[*]}/3)) if [ "$1" = "config" ]; then # root graph echo "multigraph gpu_monitor" echo "graph_title Total GPUs" echo "graph_args --base 1000 -l 0" echo "graph_vlabel GPUs" echo "graph_category GPU" echo "GPU_COUNT.label GPU count" # each graph for GPU in $(seq 0 $((GPU_TOTAL-1))) ; do echo "multigraph gpu_monitor.gpu${GPU}" echo "graph_title GPU${GPU}" echo "graph_args --base 1000 -l 0 -u 100" echo "graph_vlabel Percent or Degrees C" echo "graph_category GPU" echo "GPU_UTIL.label GPU utilization (%)" echo "GPU_MEM_UTIL.label Memory utilization (%)" echo "GPU_TEMP.label GPU temperature (C)" done exit 0 fi # root graph value echo "multigraph gpu_monitor" echo "GPU_COUNT.value ${GPU_TOTAL}" # each graph value for GPU in $(seq 0 $((GPU_TOTAL-1))) ; do GPU_TEMP=${ARRAY[$((GPU*3))]} GPU_UTIL=${ARRAY[$((GPU*3+1))]} GPU_MEM_UTIL=${ARRAY[$((GPU*3+2))]} echo "multigraph gpu_monitor.gpu${GPU}" echo "GPU_TEMP.value ${GPU_TEMP}" echo "GPU_UTIL.value ${GPU_UTIL}" echo "GPU_MEM_UTIL.value ${GPU_MEM_UTIL}" done
�돪�²¼�����������������ӏ����������������������������¹��¡�
http://blog.livedoor.jp/hakin/misc/gpu_monitor
����돢돫�³���������·�����ġ�������������돪�²¼���������¹��¡�
OS: SLES11 SP1 NVIDIA Driver: 260.19.26 CUDA: 3.2 GPU: NVIDIA Tesla S2070����M2070 x4����������
��������¡�GPGPU\µ���¼\Ð������������𡯏��������������������������·�����������Ï�������¡�
³��⏢�·�����Ώ��������¹��¡�
[2011������ 5/29 ������µ]
\���\���\���\���\�����������������¡�Munin������\��⏢�¼\��������ҏ��½¼�����·��������������������������¡�5����̏�𡭏�����������¼«����돢������돩�������������¹��Џ����Ώ��µ���������������¹��¡�
����²��я����Ώ��������·������\���\���\¹\��ď�����������¼«�����\���\������¼\�������������̏���ߏ��������«�����������ď�����������¡�Munin������HTML\���\���\��\������¼\��������ҏ�����¹¹���·�����������Ώ��������·�����ď�¡�
/etc/munin/templates/definitions.html /etc/munin/templates/munin-overview.tmpl /etc/munin/templates/partial/head.tmpl������¹¹�����
<meta http-equiv="refresh" content="300" />������¹¹������
<!-- <meta http-equiv="refresh" content="300" /> -->
���³������������¼«�����\���\������¼\������µ���������������������������������������·�����ď�¡�