O*******d 发帖数: 20343 | 1 【 以下文字转载自 Hardware 讨论区 】
发信人: OverCloud (天马行空), 信区: Hardware
标 题: 我写的CUDA屏保软件
发信站: BBS 未名空间站 (Sat Aug 13 23:32:23 2011, 美东)
前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据
你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我
用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50
次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU
计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算,
只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
屏保改成OpenCL的,就可以在NVidia和ATI的显卡上运行了
下载链接
http://www.mediafire.com/?7cgkd6kn374941h |
O*******d 发帖数: 20343 | 2 你的机器需要下载CUDA runtime cudart_32.dll |
B******m 发帖数: 2643 | 3 你感觉同样一个程序用CUDA写会快多少?
譬如我们做个non-local means那种比较费劲的去噪程序,把循环里面的部分用CUDA写
过的话跟不用差多少?
50
CPU
【在 O*******d 的大作中提到】 : 【 以下文字转载自 Hardware 讨论区 】 : 发信人: OverCloud (天马行空), 信区: Hardware : 标 题: 我写的CUDA屏保软件 : 发信站: BBS 未名空间站 (Sat Aug 13 23:32:23 2011, 美东) : 前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据 : 你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我 : 用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50 : 次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU : 计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算, : 只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
|
O*******d 发帖数: 20343 | 4 我的这个计算,如果用4核CPU计算,把4核都用上,需要1.5秒。 用GPU计算,
我试用了两个显卡,在老显卡上需要55毫秒,在新显卡上只用15毫秒。 GPU比
CPU快了100倍。 浮点数计算,GPU绝对是冠军。 当然,前提是你的算法可以平行计算。
【在 B******m 的大作中提到】 : 你感觉同样一个程序用CUDA写会快多少? : 譬如我们做个non-local means那种比较费劲的去噪程序,把循环里面的部分用CUDA写 : 过的话跟不用差多少? : : 50 : CPU
|
B******m 发帖数: 2643 | 5 多谢,我试验一下,我机器有24个核,估计CUDA加速没有那么明显了。
算。
【在 O*******d 的大作中提到】 : 我的这个计算,如果用4核CPU计算,把4核都用上,需要1.5秒。 用GPU计算, : 我试用了两个显卡,在老显卡上需要55毫秒,在新显卡上只用15毫秒。 GPU比 : CPU快了100倍。 浮点数计算,GPU绝对是冠军。 当然,前提是你的算法可以平行计算。
|
O*******d 发帖数: 20343 | 6 你如果有钱买24核的机器,可以买几个同样的NVidia显卡, CUDA可以同时使用。这样
你就有上千个处理器来平行处理数据。 同样的价钱和功率消耗,GPU比CPU要快很多。
【在 B******m 的大作中提到】 : 多谢,我试验一下,我机器有24个核,估计CUDA加速没有那么明显了。 : : 算。
|
B******m 发帖数: 2643 | 7 好的好的,是公司的机器,如果效果好的话我可以建议公司多买几个显卡装上。
【在 O*******d 的大作中提到】 : 你如果有钱买24核的机器,可以买几个同样的NVidia显卡, CUDA可以同时使用。这样 : 你就有上千个处理器来平行处理数据。 同样的价钱和功率消耗,GPU比CPU要快很多。
|
B******m 发帖数: 2643 | 8 同一台机器装多个显卡么?是我们公司的机器,如果可以的话我可以建议公司购买。
【在 O*******d 的大作中提到】 : 你如果有钱买24核的机器,可以买几个同样的NVidia显卡, CUDA可以同时使用。这样 : 你就有上千个处理器来平行处理数据。 同样的价钱和功率消耗,GPU比CPU要快很多。
|
O*******d 发帖数: 20343 | 9 如果你的机器上有多个同样的插座,可以装多个同样的显卡。 CUDA可以利用多个显卡
同时计算。电源要供应得上才行。 快速的显卡都比较费电。
【在 B******m 的大作中提到】 : 同一台机器装多个显卡么?是我们公司的机器,如果可以的话我可以建议公司购买。
|