t*****z 发帖数: 1598 | 1 楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是
GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果
如何?
不多说直接上图: |
f*******r 发帖数: 605 | |
t*****z 发帖数: 1598 | 3 双路GTX580强势镇楼。
总共花了350美元先后买了两块二手卡。现在这个程序最多只能利用一块卡,所以图中
显示的只是其中一块的结果。
看好它们的理由是早期更加适合科学计算的费米架构的顶级旗舰卡,架构上比什么泰坦
都先进,可惜老了点,表现在制程(40nm)和接口(PCIe 2.0)上。偏我这个程序对数
据交换的带宽要求特别高,一定程度上限制了它们的发挥,否则还能更强。
我的家庭超算组好已经两三个月,一点也没有浪费,七天里有五六天在跑计算。昨天接
到任务,要×尽快×做出某个结果。那当然是用我的比服务器还快的家庭超算来干了。
既然有两块卡,那就双开,一块卡跑一个重复,分别带一个CPU核心,还省下两个核心
可以做别的事情。摸一摸机器一点都不烫。生物学里面一般是要求三个重复的,要是我
还有第三块GTX580就更好了,可惜ATX的主板上插不了那么多显卡。
闲时跑了下Luxmark,是基于OpenCL的衡量显卡纯粹计算力的评测程序。我的两块
GTX580加起来得分有1908("sala"),远超包括泰坦在内任意N家单卡,大约在HD7950和
7970之间。要是我有三块卡,那就算战略核显卡泰坦Z也得跪。可惜了。
总而言之,这么套设备我是买对了。 |
t*****z 发帖数: 1598 | 4 再说7870XT,是更适合计算的A家的最适合计算的Tahiti核心的入门卡,比起7970GE,
阉割了四分之一的性能。即便如此,它的理论性能也应该秒飞了GTX580呀?特别是双精
度浮点运算能力,是后者的将近四倍。我的程序正是需要双精度的,用Tahiti岂不正好?
弄来一块7870XT插上,Win7下一切正常,Ubuntu下居然黑屏。折腾了半天才装上驱动。
跑了下分慢得离谱,大约是一楼图中显示数值的六成。遂装上了最新Linux内核(3.13
)和最新测试版Catalyst驱动(14.1)。这下大有改观,上升到了现在的分数。
我想是不是这卡太强,我的程序用不满它的核心(它的核心数是GTX580的三倍)?我试
着用更大的数据集来跑,试着用多个进程同时跑,都没有什么改进。最高的时候核心占
用率能达到75%,但是运算速度却一点也不比占用率40%的时候更高。看来是没戏了。
在Win7下也跑了分,比Linux下稍微好那么一点点(7.39分钟)。
可见AMD的驱动是烂的可以。唯一值得表扬的是14版驱动比13版驱动性能提升了一大截
,接近Windows驱动的水平了。有进步总还是好的。
总而言之我完全没有入280X的愿望了。 |
t*****z 发帖数: 1598 | 5 据我推测是内存的问题。4820K用的是四通道1866 CL9,而E3v3用的是双通道1600 CL11
。之前我那4820K的机器只有双通道的时候我也测试过,时间是11.47分钟,相比之下四
通道的8.15对它有显著提升。后来我还尝试了把内存超频到2133 CL10,时间进一步缩
短到7.86。可见我的程序对内存带宽十分敏感。也说明我当初一时糊涂买了4820K而不
是4770K,是个不坏的选择。
【在 f*******r 的大作中提到】 : 为啥4820k比1230v3快那么多啊
|
t*****z 发帖数: 1598 | 6 顺便说下现在全世界Luxmark跑分冠军是八路泰坦(12330),排第四的是四路7970(
10162),排第八的是八路GTX580(9303)。也就是说,GTX580是榜单上出现的第三种
显卡。这也说明了我买GTX580是个经得起事实检验和业界认可的选择。 |
b*****c 发帖数: 165 | 7 恭喜了。顺便问一下,如果纯玩游戏,GTX580和HD7870XT哪个更好? |
w***g 发帖数: 5958 | 8 GTX580做计算是不错。我去年搞了一块跑neural network,已经落了一年灰了。
【在 t*****z 的大作中提到】 : 楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是 : GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果 : 如何? : 不多说直接上图:
|
t*****z 发帖数: 1598 | 9 应该差不多吧。Passmark里GTX580的排名尚在HD7950之上。如果我要买游戏卡,本着买
新不买旧的原则,还是会挑7870XT的。
但是,如果我所料不错,7870XT应该是用生产出来品质最差的那一批Tahiti芯片做成的
,完全是废物利用,连AMD都不好意思宣传,官网上都没有产品信息。
【在 b*****c 的大作中提到】 : 恭喜了。顺便问一下,如果纯玩游戏,GTX580和HD7870XT哪个更好?
|
E***e 发帖数: 3430 | 10 你这个580还跑不过i7
绝壁是算法问题或者本身就不适合gpu
我用580杀i7-3770都是都是5倍以上的performance |
|
|
t*****z 发帖数: 1598 | 11 这话怎么说?我的图里显示的580对i7不是两倍以上性能优势吗?
【在 E***e 的大作中提到】 : 你这个580还跑不过i7 : 绝壁是算法问题或者本身就不适合gpu : 我用580杀i7-3770都是都是5倍以上的performance
|
E***e 发帖数: 3430 | 12 爪机看花眼了
就算两倍,感觉提高也太少了
我就随便写写都有五倍多提高啊
【在 t*****z 的大作中提到】 : 这话怎么说?我的图里显示的580对i7不是两倍以上性能优势吗?
|
E***e 发帖数: 3430 | 13 还有,我们测试了GT-640
计算能力和i-7基本持平
按照你这个结果
GT-640和7870x基本一样
不梅克森斯啊
【在 E***e 的大作中提到】 : 爪机看花眼了 : 就算两倍,感觉提高也太少了 : 我就随便写写都有五倍多提高啊
|
E***e 发帖数: 3430 | 14 FYI
【在 t*****z 的大作中提到】 : 这话怎么说?我的图里显示的580对i7不是两倍以上性能优势吗?
|
t*****z 发帖数: 1598 | 15 所以说AMD的驱动写得烂啊。我也测过DDR3版GT640,结果比GTX650稍微低一点(10%以内
),只是我正式benchmark的时候那卡已经还回去了,就没有放进统计结果。
【在 E***e 的大作中提到】 : 还有,我们测试了GT-640 : 计算能力和i-7基本持平 : 按照你这个结果 : GT-640和7870x基本一样 : 不梅克森斯啊
|
t*****z 发帖数: 1598 | 16 我想我的程序确实不能充分利用显卡。不过,我的i7-4820k是有四通道内存神秘加成的
。要和你的i7-3770相比,应该用我的E3-1230v3。GTX580比它也有3-4倍性能优势。
【在 E***e 的大作中提到】 : 爪机看花眼了 : 就算两倍,感觉提高也太少了 : 我就随便写写都有五倍多提高啊
|
E***e 发帖数: 3430 | 17 I mean your GTX 580 performance is not well optimized either...
【在 t*****z 的大作中提到】 : 所以说AMD的驱动写得烂啊。我也测过DDR3版GT640,结果比GTX650稍微低一点(10%以内 : ),只是我正式benchmark的时候那卡已经还回去了,就没有放进统计结果。
|
t*****z 发帖数: 1598 | 18 你的代码写得真不错,完全把性能发挥出来了,达到了这些设备的理论GFlops数值。
【在 E***e 的大作中提到】 : FYI
|
E***e 发帖数: 3430 | 19 not me
arrayfire
lol
【在 t*****z 的大作中提到】 : 你的代码写得真不错,完全把性能发挥出来了,达到了这些设备的理论GFlops数值。
|
E***e 发帖数: 3430 | 20 这些硬件你有多少在手上的?
我把代码发给你
你去注册个15天的arrayfire试用版
把手上的硬件一个个跑一遍如何?
比较关心580,7807XT,i7和i5
arrayfire可以在opencl上跑CPU
多谢了!
【在 t*****z 的大作中提到】 : 我想我的程序确实不能充分利用显卡。不过,我的i7-4820k是有四通道内存神秘加成的 : 。要和你的i7-3770相比,应该用我的E3-1230v3。GTX580比它也有3-4倍性能优势。
|
|
|
V**0 发帖数: 889 | 21 什么代码可以用gpu跑baysesian mcmc?
【在 t*****z 的大作中提到】 : 楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是 : GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果 : 如何? : 不多说直接上图:
|
t*****z 发帖数: 1598 | 22 http://code.google.com/p/beagle-lib/
【在 V**0 的大作中提到】 : 什么代码可以用gpu跑baysesian mcmc?
|
t*****z 发帖数: 1598 | 23 大多数是学校财产,但是我可以直接上机操作,只是不能把硬件拔下来插过去。我也很
好奇你的程序在我这可以跑多快。运行ArrayFire需要什么样的软硬件环境?
【在 E***e 的大作中提到】 : 这些硬件你有多少在手上的? : 我把代码发给你 : 你去注册个15天的arrayfire试用版 : 把手上的硬件一个个跑一遍如何? : 比较关心580,7807XT,i7和i5 : arrayfire可以在opencl上跑CPU : 多谢了!
|
E***e 发帖数: 3430 | 24 我刚才站信给你了,看到没?
【在 t*****z 的大作中提到】 : 大多数是学校财产,但是我可以直接上机操作,只是不能把硬件拔下来插过去。我也很 : 好奇你的程序在我这可以跑多快。运行ArrayFire需要什么样的软硬件环境?
|
b*********n 发帖数: 2284 | 25 显存大小要紧吗?比如7870+2G够吗,还是要搞4G的?
【在 t*****z 的大作中提到】 : 楼主出于科学计算的纯洁高尚的动机,找了一大堆CPU和GPU来做试验,自己掏钱买的是 : GTX580,借来的是HD7870XT,此外还有一大堆零碎,全用来跑Bayesian MCMC,看结果 : 如何? : 不多说直接上图:
|
E***e 发帖数: 3430 | 26 尽量搞显存大的
【在 b*********n 的大作中提到】 : 显存大小要紧吗?比如7870+2G够吗,还是要搞4G的?
|