由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Hardware版 - 请问intelCPU的HT技术能使多线程程序变快吗?
相关主题
2000刀预算,8核的台式机能买到吗?我们的龙芯3号---致龙芯15周年 (转载)
电脑性能饱和以后的发展趋势是不是4K我理想中的笔记本
现在的高端台机里面请教CPU性能的行情
i7的多线程能力还是不错的不知道该不该在这里问。。。MATLAB在i7上跑的线程问题
Intel 6核心笔记本满血跑分无敌!散热无压力AMD六核 $105
新机满载温度i7-820很让人失望。
好像cpu频率才是最关键的Intel i3, i5, i7
弱问同一程序64位OS比32位的机器运行快为什么?你们用来测试系统性能的软件叫什么?
相关话题的讨论汇总
话题: ht话题: 线程话题: 性能话题: intelcpu话题: 提升
进入Hardware版参与讨论
1 (共1页)
p******e
发帖数: 528
1
比方说我有一个6核机器,如果打开HT,原则上我可以开12个线程。
可是我发现一般来说超过6个线程后性能提升非常有限。当然这是
正常的。性能的提升不会随所开的线程数增加而线性增加。但是
会不会说虽然HT技术允许我在一个核上多开一个的线程,但是对于
数值计算来讲,这个多出来的线程实际上上还是在同一个核中计算
的,所以它们之间是有一定的竞争的。换句话说,一个六核CPU,
当我开多于6个线程之后,对性能几乎没什么提升。谢谢!
m*****n
发帖数: 3644
2
我的看法:
如果你的软件,在已经有6个core,提高到12个真core时,还能有相当的提升,比如50%
,那HT还是有点帮助。如果这时候真核翻倍,性能提高不多,那HT有可能降低。另外,
真核的提高,L3 catch肯定是有提高的。L3 catch往往多核共享。而HT相当于每个core
的专用catch(L1)减半了
s******u
发帖数: 501
3
基本上你的理解没错。HT仅仅增加了一组寄存器和loop buffer,但是取码,解码,执
行,缓存,预测机构等等全部都是共享的。其中的取码和解码单元是分时共享,可以多
少实现基于pipeline的并行化,但是其余的部分完全是竞争的关系。也就是说,HT节省
了线程context切换,以及部分解码所需要的时间,理想情况下大概会有5%-10%的性能
提升。better than nothing..
对比,PowerA2的CPU每个核心有4个FP执行单元,但是共享dispatching,比intel得HT
厚道多了,基本上能有2倍的性能提升。推土机架构了解的不多,似乎是两个整数单元
,但是共享一个FP单元,也是远好于HT

【在 p******e 的大作中提到】
: 比方说我有一个6核机器,如果打开HT,原则上我可以开12个线程。
: 可是我发现一般来说超过6个线程后性能提升非常有限。当然这是
: 正常的。性能的提升不会随所开的线程数增加而线性增加。但是
: 会不会说虽然HT技术允许我在一个核上多开一个的线程,但是对于
: 数值计算来讲,这个多出来的线程实际上上还是在同一个核中计算
: 的,所以它们之间是有一定的竞争的。换句话说,一个六核CPU,
: 当我开多于6个线程之后,对性能几乎没什么提升。谢谢!

a***e
发帖数: 27968
4
那为啥推土机性能土得掉渣

【在 s******u 的大作中提到】
: 基本上你的理解没错。HT仅仅增加了一组寄存器和loop buffer,但是取码,解码,执
: 行,缓存,预测机构等等全部都是共享的。其中的取码和解码单元是分时共享,可以多
: 少实现基于pipeline的并行化,但是其余的部分完全是竞争的关系。也就是说,HT节省
: 了线程context切换,以及部分解码所需要的时间,理想情况下大概会有5%-10%的性能
: 提升。better than nothing..
: 对比,PowerA2的CPU每个核心有4个FP执行单元,但是共享dispatching,比intel得HT
: 厚道多了,基本上能有2倍的性能提升。推土机架构了解的不多,似乎是两个整数单元
: ,但是共享一个FP单元,也是远好于HT

s******u
发帖数: 501
5
哈哈,推土机那是整体烂,本身整数浮点,管线,预测,乱序等等做的效率都远不如
intel,加起来性能当然渣了。
我上面比较的就只是单个核心上多线程的执行效率,把基准的绝对性能都拉成100%来比较

【在 a***e 的大作中提到】
: 那为啥推土机性能土得掉渣
e*i
发帖数: 10288
6
because it is 推======土=====机

【在 a***e 的大作中提到】
: 那为啥推土机性能土得掉渣
c*******h
发帖数: 107
7
俺的一个程序用i7跑4线程的话19.6分钟,8线程17分钟

【在 p******e 的大作中提到】
: 比方说我有一个6核机器,如果打开HT,原则上我可以开12个线程。
: 可是我发现一般来说超过6个线程后性能提升非常有限。当然这是
: 正常的。性能的提升不会随所开的线程数增加而线性增加。但是
: 会不会说虽然HT技术允许我在一个核上多开一个的线程,但是对于
: 数值计算来讲,这个多出来的线程实际上上还是在同一个核中计算
: 的,所以它们之间是有一定的竞争的。换句话说,一个六核CPU,
: 当我开多于6个线程之后,对性能几乎没什么提升。谢谢!

1 (共1页)
进入Hardware版参与讨论
相关主题
你们用来测试系统性能的软件叫什么?Intel 6核心笔记本满血跑分无敌!散热无压力
CPU控就再等等吧,移动版的CPU马上就要升级了新机满载温度
ivy bridge很吸引人好像cpu频率才是最关键的
请教 Intel Xeon X5687 都是4核8线程吗?弱问同一程序64位OS比32位的机器运行快为什么?
2000刀预算,8核的台式机能买到吗?我们的龙芯3号---致龙芯15周年 (转载)
电脑性能饱和以后的发展趋势是不是4K我理想中的笔记本
现在的高端台机里面请教CPU性能的行情
i7的多线程能力还是不错的不知道该不该在这里问。。。MATLAB在i7上跑的线程问题
相关话题的讨论汇总
话题: ht话题: 线程话题: 性能话题: intelcpu话题: 提升