由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 如何提高GPU的利用率
相关主题
大坑看晕了谈谈想学好底层必不可少的东西
代码开源了写给对系统感兴趣的人
10G网络到了nv的显卡能战胜intel的CPU么
GPU的本质没人讨论这个?
大牛讲讲JIT和AOT的比较吧并行可以降低计算复杂度??
再来推广下picpac妈的怎么那么多鸡毛语言/软件
GPU高手谈谈怎么利用GPU做data intensive的计算和mapreduce 吧tensorflow serving
请问程序同时在多个cpu上运行需要怎么改程序?可以简单粗暴的矩阵化的程序,都会被...
相关话题的讨论汇总
话题: cpu话题: gpu话题: v100话题: tesla
进入Programming版参与讨论
1 (共1页)
l******n
发帖数: 9344
1
我用一台带Tesla V100显卡的机器做一些图像分类,显卡的温度一直在32左右,基本没
有什么变化,功率在41W左右。Tesla V100最大功率可以到250W,最高温度到87。内存也
还有一些剩余,虽然不多。个人感觉GPU利用率还有提升的空间,哪位给点建议。
多谢
w*****r
发帖数: 197
2
titanv确实是良心卡,功耗比rtx titan低不少
f*******t
发帖数: 7549
3
是不是代码写错了没跑在GPU上?我用pytorch做training的时候显卡功率有明显变化。
o*******p
发帖数: 27
4
CPU使用率怎么样?会不会是瓶颈?把图像增大一倍试试?或者把Image Augmentation
暂时关掉看看?

【在 l******n 的大作中提到】
: 我用一台带Tesla V100显卡的机器做一些图像分类,显卡的温度一直在32左右,基本没
: 有什么变化,功率在41W左右。Tesla V100最大功率可以到250W,最高温度到87。内存也
: 还有一些剩余,虽然不多。个人感觉GPU利用率还有提升的空间,哪位给点建议。
: 多谢

l******n
发帖数: 9344
5
gpu memory usage立刻可以看出gpu使用了没有。看开始的时候我看到功率到了190W,之
后就降下来了。我一直monitor,有的时候会有一些波动,到60W,但是绝大部分时间是
41w左右
没有使用的时候只有25W

【在 f*******t 的大作中提到】
: 是不是代码写错了没跑在GPU上?我用pytorch做training的时候显卡功率有明显变化。
l******n
发帖数: 9344
6
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 12
On-line CPU(s) list: 0-11
Thread(s) per core: 1
Core(s) per socket: 1
Socket(s): 12
NUMA node(s): 1
Vendor ID: GenuineIntel
CPU family: 6
Model: 85
Model name: Intel(R) Xeon(R) Gold 6150 CPU @ 2.70GHz
Stepping: 4
CPU MHz: 2693.671
128G内存,cpu使用率不高
现在用了image augmentation,看看不用augmentation同时一次性把图片全部都到内存
,看gpu load会不会更高

Augmentation

【在 o*******p 的大作中提到】
: CPU使用率怎么样?会不会是瓶颈?把图像增大一倍试试?或者把Image Augmentation
: 暂时关掉看看?

l*******m
发帖数: 1096
7
估计cpu pipeline太慢,CPU的使用率是多少,有没有400%?最好用gpu的benchmark 程
序跑跑确认gpu没事

:我用一台带Tesla V100显卡的机器做一些图像分类,显卡的温度一直在32左右,基本
没有什么变化,功率在41W左右。Tesla V100最大功率可以到250W,最高温度到87。内存
也还有一些剩余,虽然不多。个人感觉GPU利用率还有提升的空间,哪位给点建议。
o*******p
发帖数: 27
8
试试把DataLoader里的num_workers设大些(=12)?

【在 l******n 的大作中提到】
: Architecture: x86_64
: CPU op-mode(s): 32-bit, 64-bit
: Byte Order: Little Endian
: CPU(s): 12
: On-line CPU(s) list: 0-11
: Thread(s) per core: 1
: Core(s) per socket: 1
: Socket(s): 12
: NUMA node(s): 1
: Vendor ID: GenuineIntel

1 (共1页)
进入Programming版参与讨论
相关主题
ubuntu apt-get 404了大牛讲讲JIT和AOT的比较吧
芯片應該為軟件服務,譬如硬件加速的虛擬內存MMU、虛擬GPU、虛再来推广下picpac
windows vs. colinx 程序运行效率(续)GPU高手谈谈怎么利用GPU做data intensive的计算和mapreduce 吧
what's the value for gcc -march= ?请问程序同时在多个cpu上运行需要怎么改程序?
大坑看晕了谈谈想学好底层必不可少的东西
代码开源了写给对系统感兴趣的人
10G网络到了nv的显卡能战胜intel的CPU么
GPU的本质没人讨论这个?
相关话题的讨论汇总
话题: cpu话题: gpu话题: v100话题: tesla