由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Hardware版 - 跑分结果和使用感受:GTX580完爆HD7870XT
相关主题
双精度计算的话280X和7970是不是差不多?这年头,还有这全新的Z卡卖
AMD的APU上跑ArrayFire的exceptionGeforce 210比i3集成的显示芯片如何?
3000的预算在Dell能买到什么样的workstation有没有办法破解GTX 580的双精度
【数值计算】求机器配置建议!4790K还会有deal么?
几乎是新的T42 $150值不值得买求助:Arrayfire比Matlab gpuarray慢??急在线等
神器竟成,歌以咏志。更新多CPU跑分结果。10个包子求 1000刀主机清单链接
有什么办法能把显卡开开关掉就好了水果就是牛
弱问:G1830内置的HaswellGPU能力相当于NVidia的哪款?前几天入的HD7950碰到问题了
相关话题的讨论汇总
话题: gtx580话题: hd7870xt话题: 4820k话题: arrayfire话题: 结果
进入Hardware版参与讨论
1 (共1页)
t*****z
发帖数: 1598
1
楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是
GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果
如何?
不多说直接上图:
f*******r
发帖数: 605
2
为啥4820k比1230v3快那么多啊
t*****z
发帖数: 1598
3
双路GTX580强势镇楼。
总共花了350美元先后买了两块二手卡。现在这个程序最多只能利用一块卡,所以图中
显示的只是其中一块的结果。
看好它们的理由是早期更加适合科学计算的费米架构的顶级旗舰卡,架构上比什么泰坦
都先进,可惜老了点,表现在制程(40nm)和接口(PCIe 2.0)上。偏我这个程序对数
据交换的带宽要求特别高,一定程度上限制了它们的发挥,否则还能更强。
我的家庭超算组好已经两三个月,一点也没有浪费,七天里有五六天在跑计算。昨天接
到任务,要×尽快×做出某个结果。那当然是用我的比服务器还快的家庭超算来干了。
既然有两块卡,那就双开,一块卡跑一个重复,分别带一个CPU核心,还省下两个核心
可以做别的事情。摸一摸机器一点都不烫。生物学里面一般是要求三个重复的,要是我
还有第三块GTX580就更好了,可惜ATX的主板上插不了那么多显卡。
闲时跑了下Luxmark,是基于OpenCL的衡量显卡纯粹计算力的评测程序。我的两块
GTX580加起来得分有1908("sala"),远超包括泰坦在内任意N家单卡,大约在HD7950和
7970之间。要是我有三块卡,那就算战略核显卡泰坦Z也得跪。可惜了。
总而言之,这么套设备我是买对了。
t*****z
发帖数: 1598
4
再说7870XT,是更适合计算的A家的最适合计算的Tahiti核心的入门卡,比起7970GE,
阉割了四分之一的性能。即便如此,它的理论性能也应该秒飞了GTX580呀?特别是双精
度浮点运算能力,是后者的将近四倍。我的程序正是需要双精度的,用Tahiti岂不正好?
弄来一块7870XT插上,Win7下一切正常,Ubuntu下居然黑屏。折腾了半天才装上驱动。
跑了下分慢得离谱,大约是一楼图中显示数值的六成。遂装上了最新Linux内核(3.13
)和最新测试版Catalyst驱动(14.1)。这下大有改观,上升到了现在的分数。
我想是不是这卡太强,我的程序用不满它的核心(它的核心数是GTX580的三倍)?我试
着用更大的数据集来跑,试着用多个进程同时跑,都没有什么改进。最高的时候核心占
用率能达到75%,但是运算速度却一点也不比占用率40%的时候更高。看来是没戏了。
在Win7下也跑了分,比Linux下稍微好那么一点点(7.39分钟)。
可见AMD的驱动是烂的可以。唯一值得表扬的是14版驱动比13版驱动性能提升了一大截
,接近Windows驱动的水平了。有进步总还是好的。
总而言之我完全没有入280X的愿望了。
t*****z
发帖数: 1598
5
据我推测是内存的问题。4820K用的是四通道1866 CL9,而E3v3用的是双通道1600 CL11
。之前我那4820K的机器只有双通道的时候我也测试过,时间是11.47分钟,相比之下四
通道的8.15对它有显著提升。后来我还尝试了把内存超频到2133 CL10,时间进一步缩
短到7.86。可见我的程序对内存带宽十分敏感。也说明我当初一时糊涂买了4820K而不
是4770K,是个不坏的选择。

【在 f*******r 的大作中提到】
: 为啥4820k比1230v3快那么多啊
t*****z
发帖数: 1598
6
顺便说下现在全世界Luxmark跑分冠军是八路泰坦(12330),排第四的是四路7970(
10162),排第八的是八路GTX580(9303)。也就是说,GTX580是榜单上出现的第三种
显卡。这也说明了我买GTX580是个经得起事实检验和业界认可的选择。
b*****c
发帖数: 165
7
恭喜了。顺便问一下,如果纯玩游戏,GTX580和HD7870XT哪个更好?
w***g
发帖数: 5958
8
GTX580做计算是不错。我去年搞了一块跑neural network,已经落了一年灰了。

【在 t*****z 的大作中提到】
: 楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是
: GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果
: 如何?
: 不多说直接上图:

t*****z
发帖数: 1598
9
应该差不多吧。Passmark里GTX580的排名尚在HD7950之上。如果我要买游戏卡,本着买
新不买旧的原则,还是会挑7870XT的。
但是,如果我所料不错,7870XT应该是用生产出来品质最差的那一批Tahiti芯片做成的
,完全是废物利用,连AMD都不好意思宣传,官网上都没有产品信息。

【在 b*****c 的大作中提到】
: 恭喜了。顺便问一下,如果纯玩游戏,GTX580和HD7870XT哪个更好?
E***e
发帖数: 3430
10
你这个580还跑不过i7
绝壁是算法问题或者本身就不适合gpu
我用580杀i7-3770都是都是5倍以上的performance
相关主题
神器竟成,歌以咏志。更新多CPU跑分结果。这年头,还有这全新的Z卡卖
有什么办法能把显卡开开关掉就好了Geforce 210比i3集成的显示芯片如何?
弱问:G1830内置的HaswellGPU能力相当于NVidia的哪款?有没有办法破解GTX 580的双精度
进入Hardware版参与讨论
t*****z
发帖数: 1598
11
这话怎么说?我的图里显示的580对i7不是两倍以上性能优势吗?

【在 E***e 的大作中提到】
: 你这个580还跑不过i7
: 绝壁是算法问题或者本身就不适合gpu
: 我用580杀i7-3770都是都是5倍以上的performance

E***e
发帖数: 3430
12
爪机看花眼了
就算两倍,感觉提高也太少了
我就随便写写都有五倍多提高啊

【在 t*****z 的大作中提到】
: 这话怎么说?我的图里显示的580对i7不是两倍以上性能优势吗?
E***e
发帖数: 3430
13
还有,我们测试了GT-640
计算能力和i-7基本持平
按照你这个结果
GT-640和7870x基本一样
不梅克森斯啊

【在 E***e 的大作中提到】
: 爪机看花眼了
: 就算两倍,感觉提高也太少了
: 我就随便写写都有五倍多提高啊

E***e
发帖数: 3430
14
FYI

【在 t*****z 的大作中提到】
: 这话怎么说?我的图里显示的580对i7不是两倍以上性能优势吗?
t*****z
发帖数: 1598
15
所以说AMD的驱动写得烂啊。我也测过DDR3版GT640,结果比GTX650稍微低一点(10%以内
),只是我正式benchmark的时候那卡已经还回去了,就没有放进统计结果。

【在 E***e 的大作中提到】
: 还有,我们测试了GT-640
: 计算能力和i-7基本持平
: 按照你这个结果
: GT-640和7870x基本一样
: 不梅克森斯啊

t*****z
发帖数: 1598
16
我想我的程序确实不能充分利用显卡。不过,我的i7-4820k是有四通道内存神秘加成的
。要和你的i7-3770相比,应该用我的E3-1230v3。GTX580比它也有3-4倍性能优势。

【在 E***e 的大作中提到】
: 爪机看花眼了
: 就算两倍,感觉提高也太少了
: 我就随便写写都有五倍多提高啊

E***e
发帖数: 3430
17
I mean your GTX 580 performance is not well optimized either...

【在 t*****z 的大作中提到】
: 所以说AMD的驱动写得烂啊。我也测过DDR3版GT640,结果比GTX650稍微低一点(10%以内
: ),只是我正式benchmark的时候那卡已经还回去了,就没有放进统计结果。

t*****z
发帖数: 1598
18
你的代码写得真不错,完全把性能发挥出来了,达到了这些设备的理论GFlops数值。

【在 E***e 的大作中提到】
: FYI
E***e
发帖数: 3430
19
not me
arrayfire
lol

【在 t*****z 的大作中提到】
: 你的代码写得真不错,完全把性能发挥出来了,达到了这些设备的理论GFlops数值。
E***e
发帖数: 3430
20
这些硬件你有多少在手上的?
我把代码发给你
你去注册个15天的arrayfire试用版
把手上的硬件一个个跑一遍如何?
比较关心580,7807XT,i7和i5
arrayfire可以在opencl上跑CPU
多谢了!

【在 t*****z 的大作中提到】
: 我想我的程序确实不能充分利用显卡。不过,我的i7-4820k是有四通道内存神秘加成的
: 。要和你的i7-3770相比,应该用我的E3-1230v3。GTX580比它也有3-4倍性能优势。

相关主题
4790K还会有deal么?水果就是牛
求助:Arrayfire比Matlab gpuarray慢??急在线等前几天入的HD7950碰到问题了
10个包子求 1000刀主机清单链接有没有显卡的丢啊?想上hd7950了
进入Hardware版参与讨论
V**0
发帖数: 889
21
什么代码可以用gpu跑baysesian mcmc?

【在 t*****z 的大作中提到】
: 楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是
: GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果
: 如何?
: 不多说直接上图:

t*****z
发帖数: 1598
22
http://code.google.com/p/beagle-lib/

【在 V**0 的大作中提到】
: 什么代码可以用gpu跑baysesian mcmc?
t*****z
发帖数: 1598
23
大多数是学校财产,但是我可以直接上机操作,只是不能把硬件拔下来插过去。我也很
好奇你的程序在我这可以跑多快。运行ArrayFire需要什么样的软硬件环境?

【在 E***e 的大作中提到】
: 这些硬件你有多少在手上的?
: 我把代码发给你
: 你去注册个15天的arrayfire试用版
: 把手上的硬件一个个跑一遍如何?
: 比较关心580,7807XT,i7和i5
: arrayfire可以在opencl上跑CPU
: 多谢了!

E***e
发帖数: 3430
24
我刚才站信给你了,看到没?

【在 t*****z 的大作中提到】
: 大多数是学校财产,但是我可以直接上机操作,只是不能把硬件拔下来插过去。我也很
: 好奇你的程序在我这可以跑多快。运行ArrayFire需要什么样的软硬件环境?

b*********n
发帖数: 2284
25
显存大小要紧吗?比如7870+2G够吗,还是要搞4G的?

【在 t*****z 的大作中提到】
: 楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是
: GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果
: 如何?
: 不多说直接上图:

E***e
发帖数: 3430
26
尽量搞显存大的

【在 b*********n 的大作中提到】
: 显存大小要紧吗?比如7870+2G够吗,还是要搞4G的?
1 (共1页)
进入Hardware版参与讨论
相关主题
前几天入的HD7950碰到问题了几乎是新的T42 $150值不值得买
有没有显卡的丢啊?想上hd7950了神器竟成,歌以咏志。更新多CPU跑分结果。
求推荐一个机箱有什么办法能把显卡开开关掉就好了
40年前nasa用来登月的超级计算机弱问:G1830内置的HaswellGPU能力相当于NVidia的哪款?
双精度计算的话280X和7970是不是差不多?这年头,还有这全新的Z卡卖
AMD的APU上跑ArrayFire的exceptionGeforce 210比i3集成的显示芯片如何?
3000的预算在Dell能买到什么样的workstation有没有办法破解GTX 580的双精度
【数值计算】求机器配置建议!4790K还会有deal么?
相关话题的讨论汇总
话题: gtx580话题: hd7870xt话题: 4820k话题: arrayfire话题: 结果