Sandy Bridge展望 - Hardware版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Hardware版 - Sandy Bridge展望

相关主题
● X220电池续航为什么比X201长那么多	● 没人关心AMD的32nm APU么？
● AMD又出新CPU了	● 推土机似乎很杯具呀
● 两块 Xeon E5-2687v3 CPU性能比一块 phi 5110p强啊	● 待机才5W！基于嵌入式APU的国产迷你神器
● 现在入双路工作站可以考虑2011平台了。	● 推荐一个50$左右的geforce hdmi 显卡吧！
● 小型核弹爆了，要上e5 v3的赶紧	● 有人买过clevo w110er吗？
● 哪位专家给分析一下哪个更快，i5-3210M vs i7-720QM	● 随便瞟了一眼刚才的超级本评测。。。
● 双核变单核，怎么回事？	● 联想X120e怎么样？
● 近几年来cpu性能的提升实在太缓慢令人绝望	● AMD太可怜了

相关话题的讨论汇总
话题: 缓存话题: snb话题: intel话题: bridge话题: sandy

进入Hardware版参与讨论

(共1页)

J*******3
发帖数: 1651

Sandy Bridge展望
泡泡网笔记本频道1月11日 2011年1月6日注定是个不平凡的日子，在这一天全球最
大的电子消费大展CES 2011在美国赌城拉斯维加斯拉开序幕，去年从头火到尾的苹果也
选择在这一天推出Mac App Store在线商店，而让这一天更加不平凡的便是Intel推出全
新的Sandy Bridge平台，必将引领2011年硬件、笔记本、台式机等领域的重大变革。
浮云还是板砖 Sandy Bridge能飞多久?
Click Here
如果说Intel推出的平台是产业的“领导者”和“定义者”，那么一定会有某些竞
争对手反驳，同时他们也正将此转化为行动，维持住一定市场份额，Sandy Bridge的诞
生虽得到热捧但也受到了一定程度的阻击，该如何面对强劲对手，该如何踏平2011年，
它还有许多路要走，未来的一年里Sandy Bridge到底能火多久？能飞多久？我们一起煮
酒论英雄。

Sandy Bridge简介
Sandy Bridge是英特尔即将在2011年的发布的新一代处理器微架构，仍然保持酷睿
i3、i5、i7三个系列分别针对入门级、主流应用和高端用户。从处理器层面看，Sandy
Bridge架构只是一次性能的进化，但就Nehalem/Westmere以来晶体管变化的规模而言，
绝对是一次引领技术创新的革命。
Sandy Bridge平台最大的亮点就是引入了“高级矢量扩展”指令集，简称“AVX”(
之前称作VSSE)，其重要性堪比1999年Pentium III处理器引入的SSE指令集。
Sandy Bridge平台的SIMD演算单元扩展到了256bits，同时数据传输也获得显著提
升，因此从理论上来讲，AVX指令集的引入使得CPU内核浮点运算性能提升到了2倍。
华硕N53评测
CPU-Z基本信息检索
第二代酷睿i处理器采用Intel第二代32nm HKMG工艺制造，将有八核心版本提供，
处理器二级缓存仍为512KB，但三级缓存将扩容至16MB，整合Intel第六代图形核心（核
心显卡），支持超线程技术和AES-NI、AVX指令集，其中AES-NI新增七条指令，可加速
数据加密和解密，AVX(高级矢量扩展)则针对密集型浮点运算，并协助一般用途和工程
应用的加速。由此可见，Sandy Bridge平台处理器在运算速度的提升上会非常明显。
主要特性：
1、更宽的矢量运算：从128-bit增至256-bit，并保持向下兼容性
2、增强的数据重排：单个操作可同时处理8个32-bit数据
3、支持三操作数和四操作数，非破坏性句法
4、支持弹性的访存地址不对齐
5、可扩展的新操作码(VEX)
如果您有任何意见或建议，或者有问题需要向编辑咨询以及投递相关新闻线索，欢
迎通过邮件（[email protected]）或微博（http://t.sina.com.cn/nbpop）与我们联系。期待与您的沟通，感谢您支持泡泡网笔记本电脑频道。
新特性全面解析
一、前端
从高级层面角度看，SNB架构只是一次进化，但是如果看看Nehalem/Westmere以来
晶体管变化的规模，绝对是一次革命。 Core 2引入了一种叫作循环流检测器(LSD)的逻
辑块，检测到CPU执行软件循环的时候就会关闭分枝预测器、预取/解码引擎，然后通过
自身缓存的微指令 (micro-ops)供给执行单元。这种做法通过在循环执行的时候关闭前
端节省了功耗，并改进了性能。
SNB里又增加了一个微指令缓存，用于在指令解码时临时存放。这里没有什么严格
的算法，指令只要在解码就会放入缓存。预取硬件获得一个新指令的时候，会首先检查
它是否存在于微指令缓存中，如是则由缓存为其余的管线服务，前端随之关闭。解码硬
件是x86管线里非常复杂的部分，关闭它能够节约大量的功耗。如果这种技术也能引入
到Atom处理器架构中，无疑也能使之受益匪浅。
这个缓存是直接映射的，能存储大约1.5K微指令，相当于6KB指令缓存。它位于一
级指令缓存内，大多数程序的命中率都能达到80％左右，而且带宽也相比一级指令缓存
更高、更稳定。真正的一级指令和数据缓存并没有变，仍然都是32KB，合计64KB。
Intel Sandy Bridge内核架构全面解析
这看起来有点儿像Pentium 4的追踪缓存，但最大的不同是它并不缓存追踪，而更
像是一个指令缓存，存储的是微指令，而非x86指令(macro-ops)。　　与此同时，
Intel还完全重新了一个分支预测单元(BPU)，精确度更高，并在三个方面进行了创新。
第一，标准的BPU都是2-bit预测器，每个分支都使用相关可信度(强/弱)进行标记
。Intel发现，这种双模预测器所预测的分支几乎都是强可信度的，因此SNB里多个分支
都使用一个可信度位，而不是每个分支对应一个可信度位，结果就是在分支历史表中同
样的位可以对应更多分支，进而提高预测精确度。
第二，分支目标同样做了翻新。之前的架构中分支目标的大小都是固定的，但是
大多数目标都是相对近似的。SNB现在支持多个不同的分支目标大小，而不是一味扩大
寻址能力、保存所有分支目标，因而浪费的空间更少，CPU能够跟踪更多目标、加快预
测速度。
第三，提高分枝预测器精度的传统方法是使用更多的历史位，但这只对要求长指
令的特定类型分支有效，SNB于是将分支按照长短不同历史进行划分，从而提高预测精
度。
二、物理寄存器文件(PRF)和执行改进
类似于AMD的推土机、山猫，Intel SNB也使用了物理寄存器文件。Core 2、
Nehalem架构中，每个微指令需要的每个操作数都有一份拷贝，这就意味着乱序执行硬
件(调度器/重排序缓存/关联队列)必须要非常大，以便容纳微指令和相关数据。Core
Duo时代是80-bit，加入SSE指令集后增至128-bit，现在又有了AVX指令集，按照趋势会
翻番至256-bit。
RPF在寄存器文件中存储微指令操作数，而微指令在乱序执行引擎中只会携带指向
操作数的指针，而非数据本身。这就大大降低了乱序执行硬件的功耗(转移大量数据很
费电的)，同时也减小了流水线的核心面积，数据流窗口也增大了三分之一。
核心面积的精简正是AVX指令(SNB最主要革新之一)集得以实现并保证良好性能的关
键所在。以最小的核心面积代价，Intel将所有SIMD单元都转向了256-bit。
AVX支持256-bit操作数，相当消耗晶体管与核心面积，而RPF的使用加大了乱序执
行缓冲，能够很好地满足更高吞吐量的浮点引擎。
Nehalem架构中有三个执行端口和三个执行单元堆栈：
SNB允许256-bit AVX指令借用128-bit的整数SIMD数据路径，这就使用最小的核心
面积实现了双倍的浮点吞吐量，每个时钟可以进行两个256-bit AVX操作。另外执行硬
件和路径的上位128-bit是受电源栅极(Power Gate)控制的，标准128-bit SSE操作不会
因为256-bit扩展而增加功耗。
AMD推土机架构对AVX的支持则有所不同，使用了两个128-bit SSE路径来合并成256
-bit AVX操作，即使八核心(四模块)推土机的256-bit AVX吞吐量也要比四核心SNB少一
半，不过实际影响完全取决于应用程序如何利用AVX。 SNB的峰值浮点性能翻了一番，
这就对载入和存储单元提出了更高要求。Nehalem/Westmere架构中有三个载入和存储端
口：载入、存储地址、存储数据。
SNB架构中载入和存储地址端口是对称的，都可以执行载入或者存储地址，载入带
宽因此翻倍。 SNB的整数执行也有了改进，只是比较有限。ADC指令吞吐量翻番，乘法
运算可加速25％。
三、环形总线与三级缓存
Nehalem/Westmere每个核心都与三级缓存单独相连，都需要大约1000条连线，而这
种做法的缺点是如果频繁访问三级缓存，效果可能不会太好。
SNB又整合了GPU图形核心、视频转码引擎，并共享三级缓存。Intel并没有沿用此
前的做法，再增加2000条连线，而是像服务器版的Nehalem-EX、Westmere-EX那样，引
入了环形总线(Ring Bus)，每个核心、每一块三级缓存(LLC)、集成图形核心、媒体引
擎、系统助手(System Agent)都在这条线上拥有自己的接入点，形象地说就是个“站台
”。
这条环形总线由四条独立的环组成，分别是数据环(DT)、请求环(QT)、响应环(RSP
)、侦听环(SNP)。每条环的每个站台在每个时钟周期内都能接受32字节数据，而且环的
访问总会自动选择最短的路径，以缩短延迟。随着核心数量、缓存容量的增多，缓存带
宽也随时同步增加，因而能够很好地扩展到更多核心、更大服务器集群。
这样，SNB每个核心的三级缓存带宽都是96GB/s，堪比高端Westmere，而四核心系
统更是能达到384GB/s，因为每个核心都在环上有一个接入点。
三级缓存的延迟也从大约36个周期减少到26-31个周期。此前预览的时候我们就已
经感觉到了这一点，现在终于有了确切的数字。三级缓存现在被划分成多个区块，分别
对应一个CPU核心，都在环形总线上有自己的接入点和完整缓存管线。每个核心都可以
访问全部三级缓存，只是延迟不同。此前三级缓存只有一条缓存管线，所有核心的请求
都必须通过它，现在很大程度上分而治之了。　　和以前不同的是，三级缓存的频率
现在也和核心频率同步，因而速度更快，不过缺点是三级缓存也会随着核心而降频，所
以如果CPU降频的时候GPU又正好需要访问三级缓存，速度就慢下来了。
四、系统助手
经过环形总线、三级缓存的变化，非核心(Uncore)概念还在，但是Intel改称之为
系统助手，基本就相当于曾经的北桥芯片：
PCI-E控制器，可提供16条PCI-E 2.0信道，支持单条PCI-E x16或者两条PCI-E x8
插槽；
重新设计的双通道DDR3内存控制器，内存延迟也恢复了正常水平(Westmere将内存
控制器移出CPU、放到了GPU上)；
此外还有DMI总线接口、显示引擎、电源控制单元(PCU)。
系统助手的频率要低于其他部分，有自己独立的电源层。
五、整合图形核心
Intel的集成显卡似乎总是个笑话，但这次确实不一样了。SNB的CPU性能相比现在
提升了10-30％，进化到第六代的GPU图形性能则会轻松翻好几番。
Westmere虽然也自带了图形核心，但与CPU是双内核封装，只是通过45nm工艺、更
多着色硬件、更高频率提升了性能，SNB则将CPU、GPU封装在同一内核中，全部采用
32nm工艺，特别是显著提高了IPC(指令/时钟)。
SNB GPU有自己的电源岛和时钟域，也支持Turbo Boost技术，可以独立加速或降频
，并共享三级缓存。显卡驱动会控制访问三级缓存的权限，甚至可以限制GPU使用多少
缓存。将图形数据放在缓存里就不用绕道去遥远而“缓慢”的内存了，这对提升性能、
降低功耗都大有裨益。
不过这么做并没有说起来这么简单。NVIDIA GF100核心费了九牛二虎之力，SNB其
实也差不多，同样进行了全新设计。
顺便提一下Intel的独立显卡工程Larrabee。它的重点是广泛使用全面可编程硬件(
除了纹理硬件)，SNB则是全面使用固定功能硬件，功能特性和硬件单元相对应，这样的
好处是性能、功耗、核心面积都大大优化，损失则是缺乏弹性。显然，Intel世界的中
心仍旧是CPU，不能让GPU过分强大，这和NVIDIA的理念正好相反。
可编程着色硬件被称为EU，包含着色器、核心、执行单元等，可以从多个线程双发
射时取指令。内部ISA映射和绝大多数DX10 API指令一一对应，架构很像CISC，结果就
是有效扩大了EU的宽度，IPC也显著提升。
抽象数学运算由EU内的硬件负责，性能得以同步提高。Intel表示，正弦(sine)、
余弦(cosine)操作的速度比现在的HD Graphics提升了几个数量级。
Intel此前的图形架构中，寄存器文件都是即时重新分配的。如果一个线程需要的
寄存器较少，剩余寄存器jiuihui分配给其他线程。这样虽能节省核心面积，但也会限
制性能，很多时候线程可能会面临没有寄存器可用的尴尬。在芯片组集成时代，每个线
程平均64个寄存器，Westmere HD Graphics提高到平均80个，SNB则每个线程固定为120
个。
所有这些改进加起来，SNB里每个EU的指令吞吐量都比现在的HD Graphics增加了一
倍。
SNB集成的GPU图形核心分为两大版本，分别拥有6个、12个EU。首批发布的移动版
全部是12个EU，桌面版则根据型号不同而有两种配置，可能是高端 12个、低端6个。得
益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点，即使只有六个的时候性
能也会相当令人满意。
六、媒体引擎
除了GPU图形核心，SNB中还有一个媒体处理器，专门负责视频解码、编码。
新的硬件加速解码引擎中，整个视频管线都通过固定功能单元进行解码，和现在正
好相反。Intel据此宣称，SNB在播放视频的时候功耗可降低一半。　　视频编码引擎
则是全新的。具体细节没有公布，但是Intel现场拿出了一段3分钟长的1080p 30Mbps高
清视频，将其转换成640×360 iPhone格式，结果整个过程耗时仅仅14秒钟，转换速度
高达400FPS左右，而这只花费了大约3平方毫米的核心面积。
Intel与软件产业合作密切，相信这种视频转码技术会很快得到广泛支持。
七、新一代Turbo Boost
Lynnfield Core i7/i5首次引入了智能动态加速技术“Turbo Boost”(睿频)，能
够根据工作负载，自动以适当速度开启全部核心，或者关闭部分限制核心、提高剩余核
心的速度，比如一颗热设计功耗(TDP)为 95W的四核心处理器，可能会三个核心完全关
闭，最后一个大幅提速，一直达到95W TDP的限制。　　现有处理器都是假设一旦开启
动态加速，就会达到TDP限制，但事实上并非如此，处理器不会立即变得很热，而是有
一段时间发热量距离TDP还差很多。
SNB利用这一点特性，允许单元控制单元(PCU)在短时间内将活跃核心加速到TDP以
上，然后慢慢降下来。PCU会在空闲时跟踪散热剩余空间，在系统负载加大时予以利用
。处理器空闲的时间越长，能够超越TDP的时间就越长，但最长不超过25秒钟。
不过在稳定性方面，PCU不会允许超过任何限制。
之前我们也已经说过了，SNB GPU图形核心也可以独立动态加速，最高可达惊人的1
.35GHz。如果软件需要更多CPU资源，那么CPU就会加速、GPU同时减速，反之亦然。
如果您有任何意见或建议，或者有问题需要向编辑咨询以及投递相关新闻线索，欢
迎通过邮件（[email protected]）或微博（http://t.sina.com.cn/nbpop）与我们联系。期待与您的沟通，感谢您支持泡泡网笔记本电脑频道。
竞争对手也发重量级产品
Intel最大的竞争对手当属AMD，两家芯片巨头明争暗斗多年，在强大的Sandy
Bridge平台推出之时，AMD自然也不愿落后，推出了重量级产品AMD APU。
APU是“Accelerated Processing Units”的简称，中文名字叫加速处理器，是AMD
融聚理念的产品，它第一次将处理器和独显核心做在一个晶片上，协同计算、彼此加速
，同时具有高性能处理器和最新支持DX11独立显卡的处理性能，大幅提升电脑运行效率
，实现了CPU与GPU真正的融合。APU是处理器未来发展的趋势。
将CPU与GPU整合在一起成为APU（加速处理器单元：Accelerated Processing Unit
），让PC设计实现超小外观、超低能耗、超高性能、高电池续航、高性价比和高视觉体
验，同时为用户带来最佳的平台性能体验，这些都是AMD Fusion平台所要追求的最终目
标，而随着今天AMD Fusion平台的正式发布，这一目标将变为现实，并通过用户的切身
体验来进行反馈。
Fusion平台把图形处理器和CPU集成在一个芯片上，在减少耗电量的同时提高了整
个PC性能。基于这种处理器的笔记本电脑将在不久之后召开的 CES（美国消费电子展会
）上正式推出。搭载Fusion平台的笔记本电脑将拥有长达10个小时的续航时间，并且能
够轻松完成1080p高清视频的播放任务。
融聚今天：AMD FUSION芯片正式发布
Fusion APU集成了双核CPU与DX11 GPU核心而其TDP仅有18W
融聚今天：AMD FUSION芯片正式发布
最低端的“Ontario”平台1080p高清影片播放时的CPU占用率为65%左右
2011年度首批Fusion平台拥有三个系列不同市场定位的APU产品：分别为TDP 单核
心18W、双核心25W的适用于入门级主流笔记本电脑、一体电脑上的“Zacate”平台。
TDP为9W的适用于轻薄便携笔记本产品中的“Ontario”平台，其内部一方面是基于
“山猫”(Bobcat)新架构的x86 CPU部分，有单核心、双核心两种，官方称单核心功耗
可低于1W，另一方面则是衍生自Evergreen Radeon HD 5000系列架构的DX11 GPU部分。
最后一个系列也是性能最强、集成更大规模DX11 GPU图形核心，并在CPU部分借鉴
强大的Phenom II架构的“Llano”平台。
“Zacate”平台最大的特点是以最小的能耗代价带来令人满意的游戏性能，“
Ontario”平台则能够在1080p高清影片的播放能力上远远由于先前的AMD平台笔记本电
脑，而且最长续航时间将会达到10个小时，甚至更多。而“Llano”平台则志在为用户
提供最为高端的全面性能体验。
融聚今天：AMD FUSION芯片正式发布
2011年第一季度发布的“Ontario”和“Zacate”两个系列
本次发布的Fusion平台产品为“Ontario”和“Zacate”两个系列，二者都会集成
高性能的DX11 GPU图形核心，可兼顾3D游戏和高清影音娱乐，并支持OpenGL、DX11
DirectCompute等开放标准的并行加速计算，同时还有基于全新设计超低功耗架构“山
猫”(Bobcat)的两个CPU核心发布，而高性能 “Llano”平台将于今年中旬登场。
如果您有任何意见或建议，或者有问题需要向编辑咨询以及投递相关新闻线索，欢
迎通过邮件（[email protected]）或微博（http://t.sina.com.cn/nbpop）与我们联系。期待与您的沟通，感谢您支持泡泡网笔记本电脑频道。
风云莫测 Sandy Bridge能飞多久
在Intel Sandy Bridge发布会上，众多厂商皆展出搭载该平台的新款笔记本电脑，
我们先大致浏览其中几款新品：
长城T43H和联想V470
Acer 4750G和三星SF411
Intel Sandy Bridge，定位中高端市场，拥有新的架构与更有效率的核心，它也有
个显示核心，通过新的睿频加速可以获得很好的性能，满足用户的苛刻的性能需求,而
AMD则兼顾高端与主流市场,号称将会把曾经只有高端PC才能享受的逼真数字计算体验带
往开放价位的主流领域，为用户提供更加舒适方便的使用体验。
不论Intel Sandy Bridge有多么的强悍，不论AMD APU有多么的威武，不论产品定
位如何不同，最终他们都将在笔记本电脑市场上展示自己，也就意味着市场才是最终的
舞台，但从前一段时间和近期的消息来看，各大厂商纷纷跟进，皆推出了旗下最新款笔
记本电脑产品。正值CES 2011大展之际，给国内外PC厂商提供了展示新品的大好机会，
这也预示着2011年的笔记本市场必将血雨腥风，最终受益的不仅仅是Intel和AMD还有广
大的消费者和众厂商。
2011刚刚开始，Sandy Bridge打响了今年的第一炮，随后的日子里即使前面满布荆
棘它也会载着CPU和GPU勇往直前，就目前情况和相关测试而言，Sandy Bridge不会是那
“天边的浮云”，更像是那“给力的板砖”，敲开全新的2011年笔记本大门。如果哪天
“板砖”被吹上了天成了一片“浮云”相信也是市场的过渡期，待市场、售价和消费者
完全接受它的时候，那Sandy Bridge将继续给力2011。

t****g
发帖数: 35582

欢迎火星归来。

【在 J*******3 的大作中提到】

: Sandy Bridge展望
: 泡泡网笔记本频道1月11日 2011年1月6日注定是个不平凡的日子，在这一天全球最
: 大的电子消费大展CES 2011在美国赌城拉斯维加斯拉开序幕，去年从头火到尾的苹果也
: 选择在这一天推出Mac App Store在线商店，而让这一天更加不平凡的便是Intel推出全
: 新的Sandy Bridge平台，必将引领2011年硬件、笔记本、台式机等领域的重大变革。
: 浮云还是板砖 Sandy Bridge能飞多久?
: Click Here
: 如果说Intel推出的平台是产业的“领导者”和“定义者”，那么一定会有某些竞
: 争对手反驳，同时他们也正将此转化为行动，维持住一定市场份额，Sandy Bridge的诞
: 生虽得到热捧但也受到了一定程度的阻击，该如何面对强劲对手，该如何踏平2011年，

(共1页)

进入Hardware版参与讨论

相关主题
● AMD太可怜了	● 小型核弹爆了，要上e5 v3的赶紧
● AMD新款SoC架构APU不会是joke?	● 哪位专家给分析一下哪个更快，i5-3210M vs i7-720QM
● 大家也关心一下AMD吧	● 双核变单核，怎么回事？
● AMD combo	● 近几年来cpu性能的提升实在太缓慢令人绝望
● X220电池续航为什么比X201长那么多	● 没人关心AMD的32nm APU么？
● AMD又出新CPU了	● 推土机似乎很杯具呀
● 两块 Xeon E5-2687v3 CPU性能比一块 phi 5110p强啊	● 待机才5W！基于嵌入式APU的国产迷你神器
● 现在入双路工作站可以考虑2011平台了。	● 推荐一个50$左右的geforce hdmi 显卡吧！

相关话题的讨论汇总
话题: 缓存话题: snb话题: intel话题: bridge话题: sandy

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天