由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Hardware版 - 我写的CUDA屏保软件
相关主题
3000的预算在Dell能买到什么样的workstationGTX480还不如GTX295
ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?Geforce 210比i3集成的显示芯片如何?
【数值计算】求机器配置建议!能run photoshop, video editing的笔记本得什么配置?
大家说说 cuda 和 opencl 吧求个建议装机计算用
那个$749的Lenovo Y470算是deal吗?现在AMD和NVidia计算方面的对比都不公平
请问有没有Nvidia GPU在CUDA上计算的benchmarkAMD的APU上跑ArrayFire的exception
请推荐4U机箱和电源(4GPU)双精度计算的话280X和7970是不是差不多?
ati stream和nv的CUDA哪个好用点?求廉价无扇NV亮机卡deal
相关话题的讨论汇总
话题: gpu话题: cpu话题: cuda话题: 屏保话题: 计算
进入Hardware版参与讨论
1 (共1页)
O*******d
发帖数: 20343
1
前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据
你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我
用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50
次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU
计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算,
只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
屏保改成OpenCL的,就可以在NVidia和ATI的显卡上运行了
下载链接
http://www.mediafire.com/?7cgkd6kn374941h
a***e
发帖数: 27968
2
u try to get a screensaver that
consume more power than you are play video game?
it sounds more last a screenburner.

50
CPU

【在 O*******d 的大作中提到】
: 前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据
: 你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我
: 用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50
: 次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU
: 计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算,
: 只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
: 屏保改成OpenCL的,就可以在NVidia和ATI的显卡上运行了
: 下载链接
: http://www.mediafire.com/?7cgkd6kn374941h

c********l
发帖数: 8138
3
哈哈,我也觉得是
不过楼主的技术值得称赞!

【在 a***e 的大作中提到】
: u try to get a screensaver that
: consume more power than you are play video game?
: it sounds more last a screenburner.
:
: 50
: CPU

M********y
发帖数: 1964
4
有64位版么?

50
CPU

【在 O*******d 的大作中提到】
: 前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据
: 你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我
: 用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50
: 次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU
: 计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算,
: 只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
: 屏保改成OpenCL的,就可以在NVidia和ATI的显卡上运行了
: 下载链接
: http://www.mediafire.com/?7cgkd6kn374941h

O*******d
发帖数: 20343
5
还没有。 这个32位版可以在64位机器上运行。

【在 M********y 的大作中提到】
: 有64位版么?
:
: 50
: CPU

O*******d
发帖数: 20343
6
这个屏保相当不环保。 基本把显卡的GPU潜力挖尽。

【在 a***e 的大作中提到】
: u try to get a screensaver that
: consume more power than you are play video game?
: it sounds more last a screenburner.
:
: 50
: CPU

M********y
发帖数: 1964
7
提示说cudart_32.dll missing

【在 O*******d 的大作中提到】
: 还没有。 这个32位版可以在64位机器上运行。
O*******d
发帖数: 20343
8
你需要下载cudart_32.dll。 这个dll是CUDA的runtime。 最简单的就是下载全套CUDA
SDK

【在 M********y 的大作中提到】
: 提示说cudart_32.dll missing
l*****e
发帖数: 276
9
有意思.
这个冬天用合适,显卡当小电暖气使.
O*******d
发帖数: 20343
10
运行开始后,有一个叫test2.txt的文件被产生或更新。 其内容如下
15.518912 18.481120
15.595360 18.413234
18.680639 24.259508
15.684287 19.304968
15.714080 21.223647
15.708960 19.361958
timer 22, TimerScaleFactor 2.666667
前六排的第一个数字是计算一幅图像GPU运行时间,单位是毫秒。 第二个数字是一幅图
像的总时间,包括图像的后处理和显示。 timer 22的意思是刷屏一次要用22毫秒。用
的是上边6次的平均值区间化。 这个数字可以用来判断你的显卡的GPU能力。
相关主题
请问有没有Nvidia GPU在CUDA上计算的benchmarkGTX480还不如GTX295
请推荐4U机箱和电源(4GPU)Geforce 210比i3集成的显示芯片如何?
ati stream和nv的CUDA哪个好用点?能run photoshop, video editing的笔记本得什么配置?
进入Hardware版参与讨论
N****w
发帖数: 21578
11
这个是不是比较耗电...hehe

50
CPU

【在 O*******d 的大作中提到】
: 前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据
: 你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我
: 用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50
: 次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU
: 计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算,
: 只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
: 屏保改成OpenCL的,就可以在NVidia和ATI的显卡上运行了
: 下载链接
: http://www.mediafire.com/?7cgkd6kn374941h

O*******d
发帖数: 20343
12
是的。GPU计算都比较费电。 在我的系统上,要多费电100瓦。

【在 N****w 的大作中提到】
: 这个是不是比较耗电...hehe
:
: 50
: CPU

h********o
发帖数: 152
13
这是保屏爆卡的利器啊,就看哪个抗得久了
a***a
发帖数: 40617
14
。。。。。。。

【在 O*******d 的大作中提到】
: 是的。GPU计算都比较费电。 在我的系统上,要多费电100瓦。
d**o
发帖数: 864
15
牛啊...
我这两天也在想用GPU写一个数值积分的算法...
GPU编程太伤脑筋了.

50
CPU

【在 O*******d 的大作中提到】
: 前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据
: 你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我
: 用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50
: 次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU
: 计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算,
: 只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
: 屏保改成OpenCL的,就可以在NVidia和ATI的显卡上运行了
: 下载链接
: http://www.mediafire.com/?7cgkd6kn374941h

g*******g
发帖数: 9753
16
这个耗的也太狠了
你看看有没有优化的办法

【在 O*******d 的大作中提到】
: 是的。GPU计算都比较费电。 在我的系统上,要多费电100瓦。
j*******g
发帖数: 79
17
好啊
现在一提并行就是cuda
楼主 有没有想过opencl什么的
O*******d
发帖数: 20343
18
准备把这个屏保改成OpenCL。

【在 j*******g 的大作中提到】
: 好啊
: 现在一提并行就是cuda
: 楼主 有没有想过opencl什么的

O*******d
发帖数: 20343
19
这个没有办法。 GPU有几十个到几百个处理器平行计算。 只要计算,就会耗电。
越快的显卡,耗电越大。 其实同样的计算量,GPU比CPU省电。因为GPU硬件
优化了浮点数计算。 比如说我这个程序,在100瓦的计算功率下,每20毫秒即可
计算出一幅图像,而使用4核CPU,耗电50瓦,计算一幅图像需要1.5秒。 使用
GPU的目的是为了大量快速计算,大量计算就费电了。现在的GPU计算速度已经
和80年代的超级计算机相当了。

【在 g*******g 的大作中提到】
: 这个耗的也太狠了
: 你看看有没有优化的办法

O*******d
发帖数: 20343
20
平行计算,需要理解两个概念。 一个是数据平行,每一个点数据的计算和
其他点数据无关。我用的就是数据平行。 图形中的每一个点的计算都是独
立的,由该点的x,y,z来决定的。 另一个概念是任务平行,就是把一个大任
务分割成几个互相独立的小任务,送到多个处理器平行处理。 比如说,
memcpy这个C函数,如果copy的数据巨大,可以分成几个小区间的memcpy,
分给几个处理器去平行操作。

【在 d**o 的大作中提到】
: 牛啊...
: 我这两天也在想用GPU写一个数值积分的算法...
: GPU编程太伤脑筋了.
:
: 50
: CPU

相关主题
求个建议装机计算用双精度计算的话280X和7970是不是差不多?
现在AMD和NVidia计算方面的对比都不公平求廉价无扇NV亮机卡deal
AMD的APU上跑ArrayFire的exception我的机器提高计算速度的的潜力有多大?
进入Hardware版参与讨论
t**o
发帖数: 840
21
楼主很在行。
D**i
发帖数: 190
22
对于液晶屏,所谓的ScreenSaver都是ScreenBurner
但楼主这个是Video Card Burner

【在 a***e 的大作中提到】
: u try to get a screensaver that
: consume more power than you are play video game?
: it sounds more last a screenburner.
:
: 50
: CPU

m*p
发帖数: 1331
23
sigh, 不知道是哪国的教育失败
T****n
发帖数: 6187
24
牛,能显示帧数吗?可以作为测cude的软件

50
CPU

【在 O*******d 的大作中提到】
: 前段时间在研究CUDA,写了一个练习用的屏保。下边是截屏图。 图形是动画的。 根据
: 你的显卡的能力,在1920x1080屏幕上,图像帧频可以自动从15赫兹到60赫兹变换。我
: 用的GeForce8600GTS,图像每秒可以更新15次。 最近换了GeForce460 图像更新每秒50
: 次。 图形是低频的Perlin Noise。 以前写过一个CPU的类似屏保,但QuadCore的CPU
: 计算一幅图像要1.5秒左右,还是用了OpenMP,但也无法实现实时动画。 用GPU计算,
: 只需要20毫秒即完成。 现在这个屏保只能在NVidia显卡上运行,准备过段时间把这个
: 屏保改成OpenCL的,就可以在NVidia和ATI的显卡上运行了
: 下载链接
: http://www.mediafire.com/?7cgkd6kn374941h

M********y
发帖数: 1964
25
这个建议好,同顶一下。

【在 T****n 的大作中提到】
: 牛,能显示帧数吗?可以作为测cude的软件
:
: 50
: CPU

j*******g
发帖数: 79
26
牛呀 等待opencl 我也最近正研究 message passing 类的 learning 算法如何并行实
现 不知道选 cuda 还是 opencl

【在 O*******d 的大作中提到】
: 准备把这个屏保改成OpenCL。
t****t
发帖数: 6806
27
我能不能问一下你这感叹是从哪里来的?

【在 m*p 的大作中提到】
: sigh, 不知道是哪国的教育失败
z****c
发帖数: 602
28
挺好,有没有计划公开源代码?
O*******d
发帖数: 20343
29
运行开始后,有一个叫test2.txt的文件被产生或更新。 其内容如下
15.518912 18.481120
15.595360 18.413234
18.680639 24.259508
15.684287 19.304968
15.714080 21.223647
15.708960 19.361958
timer 22, TimerScaleFactor 2.666667
前六排的第一个数字是计算一幅图像GPU运行时间,单位是毫秒。 第二个数字是一幅图
像的总时间,包括图像的后处理和显示。 timer 22的意思是刷屏一次要用22毫秒。用
的是上边6次的平均值区间化。 这个数字可以用来判断你的显卡的GPU能力。 记录的
刷屏时间范围从15毫秒到60毫秒, 超出范围的都收在范围的边界上, 不是真实值。 但GPU时间是真实的。

【在 T****n 的大作中提到】
: 牛,能显示帧数吗?可以作为测cude的软件
:
: 50
: CPU

O*******d
发帖数: 20343
30
CUDA只能在NVidia显卡上运行。 OpenCL应该可以在NVidia和ATI的显卡上运行。

【在 j*******g 的大作中提到】
: 牛呀 等待opencl 我也最近正研究 message passing 类的 learning 算法如何并行实
: 现 不知道选 cuda 还是 opencl

相关主题
rx480价格雪崩啊ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?
矿机问题【数值计算】求机器配置建议!
3000的预算在Dell能买到什么样的workstation大家说说 cuda 和 opencl 吧
进入Hardware版参与讨论
O*******d
发帖数: 20343
31
可以公开。 等我把我的个人信息去掉再公开。 整个计算稍微复杂。分三步, 首先计
算Perlin Noise。 然后做Bicubic Interpolation进行插值。 一共插4个值,然后赋予
颜色,再把4个颜色值平均,就是最后的像素颜色。 做三次方插值是为了antialiase。
但计算时间多了一倍。 你可以注意到图形曲线是非常平滑没有锯齿的。 按空格键可
以截屏存成jpg文件。

【在 z****c 的大作中提到】
: 挺好,有没有计划公开源代码?
O*******d
发帖数: 20343
m****s
发帖数: 1481
33
memcpy实际上还是数据并行,而且这个受memory bandwidth局限,不是最能体现GPU加
速的任务。
任务并行应该是多核cpu的意思,不同的核干不同的活,有的画图,有的算物理这样。
不过gpu在任务并行上也有局限,不是所有的核都能完全独立干活的,不管n家还是a家
,都是16/32个核得干一样的事情。gpu最佳的任务还是数据并行,并且要有足够大的计
算/读内存比来饱和核计算量

【在 O*******d 的大作中提到】
: 平行计算,需要理解两个概念。 一个是数据平行,每一个点数据的计算和
: 其他点数据无关。我用的就是数据平行。 图形中的每一个点的计算都是独
: 立的,由该点的x,y,z来决定的。 另一个概念是任务平行,就是把一个大任
: 务分割成几个互相独立的小任务,送到多个处理器平行处理。 比如说,
: memcpy这个C函数,如果copy的数据巨大,可以分成几个小区间的memcpy,
: 分给几个处理器去平行操作。

1 (共1页)
进入Hardware版参与讨论
相关主题
求廉价无扇NV亮机卡deal那个$749的Lenovo Y470算是deal吗?
我的机器提高计算速度的的潜力有多大?请问有没有Nvidia GPU在CUDA上计算的benchmark
rx480价格雪崩啊请推荐4U机箱和电源(4GPU)
矿机问题ati stream和nv的CUDA哪个好用点?
3000的预算在Dell能买到什么样的workstationGTX480还不如GTX295
ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?Geforce 210比i3集成的显示芯片如何?
【数值计算】求机器配置建议!能run photoshop, video editing的笔记本得什么配置?
大家说说 cuda 和 opencl 吧求个建议装机计算用
相关话题的讨论汇总
话题: gpu话题: cpu话题: cuda话题: 屏保话题: 计算