由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Hardware版 - 请问有没有Nvidia GPU在CUDA上计算的benchmark
相关主题
大家帮看看这台做GPU并行计算的机器【数值计算】求机器配置建议!
现在AMD和NVidia计算方面的对比都不公平大家说说 cuda 和 opencl 吧
求个建议装机计算用那个$749的Lenovo Y470算是deal吗?
用于科学计算的单机该怎么配请推荐4U机箱和电源(4GPU)
有什么好的GPU计算平台推荐吗?矿机问题
3000的预算在Dell能买到什么样的workstationAMD的APU上跑ArrayFire的exception
ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?有了解AMD的APU的大虾吗?
我写的CUDA屏保软件ZZ显卡之争:NVIDIA笔记本反弹 AMD桌面前进
相关话题的讨论汇总
话题: cuda话题: nv话题: gpu话题: opencl话题: amd
进入Hardware版参与讨论
1 (共1页)
E***e
发帖数: 3430
1
具体到Monte Carlo的最好
类似这样的
找到的benchmark全都是在OpenCL上跑NV,明显不太公平
所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense
matrix, hyper之类不着边的东西。
我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!
S******n
发帖数: 5022
2
算Monte Carlo还是AMD的卡好。
CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
只要不涉及复杂的包含函数的科学计算,一般都是AMD的显卡快。特别是像金融计算、
密码学计算。

【在 E***e 的大作中提到】
: 具体到Monte Carlo的最好
: 类似这样的
: 找到的benchmark全都是在OpenCL上跑NV,明显不太公平
: 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
: 问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense
: matrix, hyper之类不着边的东西。
: 我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!

E***e
发帖数: 3430
3
要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了

【在 S******n 的大作中提到】
: 算Monte Carlo还是AMD的卡好。
: CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
: 只要不涉及复杂的包含函数的科学计算,一般都是AMD的显卡快。特别是像金融计算、
: 密码学计算。

z******i
发帖数: 1292
4
不如比微软的direct computing, AMD和NV就各显神通了。
NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。
你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言,
那个性能好。这个比法本来就有些不公平啊。

【在 E***e 的大作中提到】
: 要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了
a*s
发帖数: 425
5
像他这种问法,还那么狂,有意义么,太自以为是了
这里本来就是硬件论坛,不是科学计算的论坛,
而且,大家都可以有发表自己意见的权利
刚才我叫他自宫,他还真自宫了
然后,再起这个帖子,还在里面说什么”犯贱“
真不知道,这家伙怎么想的
你再自宫啊

【在 z******i 的大作中提到】
: 不如比微软的direct computing, AMD和NV就各显神通了。
: NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。
: 你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言,
: 那个性能好。这个比法本来就有些不公平啊。

E***e
发帖数: 3430
6
我只是从计算角度出发,不是从硬件角度出发
你用OpenCL在NV的GPU上跑计算
隔着一层转换
明显不是最高的效率
像一楼这样的比较根本没比头
从计算的角度,要比就要比同样的simulation
AMD在OpenCL上编
NV在CUDA上编
然后两个拼速度
这才有意义

【在 z******i 的大作中提到】
: 不如比微软的direct computing, AMD和NV就各显神通了。
: NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。
: 你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言,
: 那个性能好。这个比法本来就有些不公平啊。

z******i
发帖数: 1292
7
http://vga.zol.com.cn/410/4108339.html
http://vga.zol.com.cn/410/4108340.html
http://vga.zol.com.cn/410/4108341.html
http://vga.zol.com.cn/410/4108342.html

【在 E***e 的大作中提到】
: 我只是从计算角度出发,不是从硬件角度出发
: 你用OpenCL在NV的GPU上跑计算
: 隔着一层转换
: 明显不是最高的效率
: 像一楼这样的比较根本没比头
: 从计算的角度,要比就要比同样的simulation
: AMD在OpenCL上编
: NV在CUDA上编
: 然后两个拼速度
: 这才有意义

E***e
发帖数: 3430
8
可是依然没有互相独立线程计算的暴力重复啊
CFD和其他用于图形的矩阵运算其实还不是monte carlo那么简单粗暴的

【在 z******i 的大作中提到】
: http://vga.zol.com.cn/410/4108339.html
: http://vga.zol.com.cn/410/4108340.html
: http://vga.zol.com.cn/410/4108341.html
: http://vga.zol.com.cn/410/4108342.html

a***e
发帖数: 27968
9
NV从opencl到CUDA会出现2X的性能损失不?

【在 E***e 的大作中提到】
: 具体到Monte Carlo的最好
: 类似这样的
: 找到的benchmark全都是在OpenCL上跑NV,明显不太公平
: 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
: 问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense
: matrix, hyper之类不着边的东西。
: 我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!

E***e
发帖数: 3430
10
这就是我最好奇的问题
看了一圈下来没人说这件事
然后tomshardware拼命的在OpenCL上拼硬件
越来越有一种AMD写手的感觉

【在 a***e 的大作中提到】
: NV从opencl到CUDA会出现2X的性能损失不?
相关主题
3000的预算在Dell能买到什么样的workstation【数值计算】求机器配置建议!
ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?大家说说 cuda 和 opencl 吧
我写的CUDA屏保软件那个$749的Lenovo Y470算是deal吗?
进入Hardware版参与讨论
a***e
发帖数: 27968
11
很难想象会出现2X
Nv的OpenCL又不是什么新手
CUDA这种独门独户的东西,学校里用用,搞搞科研,上几个免费PHD靠谱
说实话,你要是软件公司的,除非NV给钱
否则你愿意搞个东西除了NV上能跑其他都不能跑的
写OpenCL的,至少都跑起来了,就算在NV效率差点,
也比CUDA在AMD和其他的完全起不来靠谱
你要的这种数据,其实应该看NV的market文档
要是丫自己都不敢吹,真的就别抱太大希望

【在 E***e 的大作中提到】
: 这就是我最好奇的问题
: 看了一圈下来没人说这件事
: 然后tomshardware拼命的在OpenCL上拼硬件
: 越来越有一种AMD写手的感觉

E***e
发帖数: 3430
12
如果2X以内,那绝对AMD靠谱了
OpenCL唯一要解决的就是一些数学函数还没找到好的Library
回头试试ArrayFire
多谢了!

【在 a***e 的大作中提到】
: 很难想象会出现2X
: Nv的OpenCL又不是什么新手
: CUDA这种独门独户的东西,学校里用用,搞搞科研,上几个免费PHD靠谱
: 说实话,你要是软件公司的,除非NV给钱
: 否则你愿意搞个东西除了NV上能跑其他都不能跑的
: 写OpenCL的,至少都跑起来了,就算在NV效率差点,
: 也比CUDA在AMD和其他的完全起不来靠谱
: 你要的这种数据,其实应该看NV的market文档
: 要是丫自己都不敢吹,真的就别抱太大希望

l*****e
发帖数: 714
13
titan不是号称有很强的科学计算能力吗,怎么比7970Ghz差这么多
p**********r
发帖数: 1693
14
可以查一下folding ppd或者boinc显卡项目的performance,其中wuprop项目就是专门
统计硬件计算能力的
http://wuprop.boinc-af.org/results/delai.py
E***e
发帖数: 3430
15
看不懂这网站是在干吗啊 T_T

【在 p**********r 的大作中提到】
: 可以查一下folding ppd或者boinc显卡项目的performance,其中wuprop项目就是专门
: 统计硬件计算能力的
: http://wuprop.boinc-af.org/results/delai.py

S******n
发帖数: 5022
16
因为titan有个开关,打开双精度开关,显卡频率下降,就是一计算卡。
而关闭双精度开关,显卡频率上升,就是一游戏卡。
自己决定。

【在 l*****e 的大作中提到】
: titan不是号称有很强的科学计算能力吗,怎么比7970Ghz差这么多
p**********r
发帖数: 1693
17
boinc是伯克利大学搞的一个开放式分布式计算平台,志愿者帮科研单位利用pc空闲能
力做计算,我上面给的链接是其中一个特殊的项目,专门统计各种机器计算效率的;目
前支持显卡计算的分布式项目有不下十个,跟生物有关的n卡项目我只记得gpugrid,你
可以查查她们用哪种方法计算.
folding@home是斯坦福一个生物教授搞的封闭式分布志愿计算平台,比boinc早了好几
年,是影响力和志愿者人数最多的分布式项目,单核cpu,多核cpu,a卡
n卡都支持;folding point per day是一个衡量显卡通用计算能力的比较直观的数据,
好多新卡评测里有这一项,网上统计数据比较多,又是做生物计算的,你可以重点查查
这是一个中文社区,没什么学术价值,你可以看看当科普了
http://www.equn.com/wiki
http://www.equn.com/forum/forum.php

【在 E***e 的大作中提到】
: 看不懂这网站是在干吗啊 T_T
E***e
发帖数: 3430
18
多谢了!!!

【在 p**********r 的大作中提到】
: boinc是伯克利大学搞的一个开放式分布式计算平台,志愿者帮科研单位利用pc空闲能
: 力做计算,我上面给的链接是其中一个特殊的项目,专门统计各种机器计算效率的;目
: 前支持显卡计算的分布式项目有不下十个,跟生物有关的n卡项目我只记得gpugrid,你
: 可以查查她们用哪种方法计算.
: folding@home是斯坦福一个生物教授搞的封闭式分布志愿计算平台,比boinc早了好几
: 年,是影响力和志愿者人数最多的分布式项目,单核cpu,多核cpu,a卡
: n卡都支持;folding point per day是一个衡量显卡通用计算能力的比较直观的数据,
: 好多新卡评测里有这一项,网上统计数据比较多,又是做生物计算的,你可以重点查查
: 这是一个中文社区,没什么学术价值,你可以看看当科普了
: http://www.equn.com/wiki

S******n
发帖数: 5022
19
最新的超级计算机排行榜公布之际,NVIDIA也趁机发布了号称有史以来性能最强的加速
器——Tesla K40 GPU。
Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
GK110大核心,这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
启了2688个流处理器,今天的Tesla K40则开满了全部2880个,而且用的是B1步进的新
核心。
不仅如此,Tesla K40的频率更高了,核心从732MHz提升到745MHz,并支持动态加速,
且有810MHz、875MHz两个档次,浮点性能因此增至单精度4.29TFlops、双精度1.
43TFlops(3:1)。
而显存不但频率从5.2GHz提升至6GHz,容量也翻一番、在该系列中首次达到了惊人的
12GB,为此使用了刚刚量产不久的4Gb(512MB) GDDR5显存颗粒,因此依旧是24颗。配合
384-bit的位宽,带宽也来到了288GB/s。
更令人印象深刻的是,Tesla K40的热设计功耗依然保持在235W。
E***e
发帖数: 3430
20
nv家的flops水分很大啊。。。

【在 S******n 的大作中提到】
: 最新的超级计算机排行榜公布之际,NVIDIA也趁机发布了号称有史以来性能最强的加速
: 器——Tesla K40 GPU。
: Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
: GK110大核心,这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
: 启了2688个流处理器,今天的Tesla K40则开满了全部2880个,而且用的是B1步进的新
: 核心。
: 不仅如此,Tesla K40的频率更高了,核心从732MHz提升到745MHz,并支持动态加速,
: 且有810MHz、875MHz两个档次,浮点性能因此增至单精度4.29TFlops、双精度1.
: 43TFlops(3:1)。
: 而显存不但频率从5.2GHz提升至6GHz,容量也翻一番、在该系列中首次达到了惊人的

相关主题
请推荐4U机箱和电源(4GPU)有了解AMD的APU的大虾吗?
矿机问题ZZ显卡之争:NVIDIA笔记本反弹 AMD桌面前进
AMD的APU上跑ArrayFire的exception跑浮点运算,现在是AMD的好还是Nvidia的好?
进入Hardware版参与讨论
S******n
发帖数: 5022
21
怎么水分了?这张卡要$5500, 要是还差,就太对不住这价钱了。
跟Telsa K20X的对比:

【在 E***e 的大作中提到】
: nv家的flops水分很大啊。。。
S******n
发帖数: 5022
22
NVIDIA今天(11-19-2013)宣布了另外一条重要消息:已经与蓝色巨人IBM达成了广泛
的合作协议,将共同推进超级计算机技术的前进,IBM的软硬件都将支持NVIDIA GPU加
速。
首先在软件方面,IBM的各种企业级软件,包括、商业智能、预测分析、风险分析等等(
比如InfoSphere),都将会引入CUDA GPU加速。
数据分析虽然一般不属于超级计算项目,但也需要强大的计算能力做支撑,这显然给
Tesla留下了充足的空间。
E***e
发帖数: 3430
23
那titan跑monte carlo比amd落后那么多
是因为amd专长monte carlo?

【在 S******n 的大作中提到】
: 怎么水分了?这张卡要$5500, 要是还差,就太对不住这价钱了。
: 跟Telsa K20X的对比:

S******n
发帖数: 5022
24
你贴的那个图应该是7990写错写成7970了。
正确的图是
7990是两块7970,所以大幅度领先Titan。
7970GE的monte carlo单精度下领先Titan 30%,双精度下领先Titan 20%——AMD的确专
长monte carlo。

【在 E***e 的大作中提到】
: 那titan跑monte carlo比amd落后那么多
: 是因为amd专长monte carlo?

E***e
发帖数: 3430
25
谢谢谢谢谢谢谢谢!

【在 S******n 的大作中提到】
: 你贴的那个图应该是7990写错写成7970了。
: 正确的图是
: 7990是两块7970,所以大幅度领先Titan。
: 7970GE的monte carlo单精度下领先Titan 30%,双精度下领先Titan 20%——AMD的确专
: 长monte carlo。

1 (共1页)
进入Hardware版参与讨论
相关主题
ZZ显卡之争:NVIDIA笔记本反弹 AMD桌面前进有什么好的GPU计算平台推荐吗?
跑浮点运算,现在是AMD的好还是Nvidia的好?3000的预算在Dell能买到什么样的workstation
觉得今年AMD CPU GPU有的一战么?ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?
实验室要配机器,不差钱的,搞这个我写的CUDA屏保软件
大家帮看看这台做GPU并行计算的机器【数值计算】求机器配置建议!
现在AMD和NVidia计算方面的对比都不公平大家说说 cuda 和 opencl 吧
求个建议装机计算用那个$749的Lenovo Y470算是deal吗?
用于科学计算的单机该怎么配请推荐4U机箱和电源(4GPU)
相关话题的讨论汇总
话题: cuda话题: nv话题: gpu话题: opencl话题: amd