由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Hardware版 - 相比龙芯,申威的“芯”路历程为什么平坦很多? (转载)
相关主题
龙芯无奈购美公司专利授权 CPU自主产权战略失败 (ZT) (转载)能不能硬盘转化成RAID 0而不重装系统?
zzz: 龙芯与mips要买个2T的硬盘
FYI 中国龙芯CPU的调查与研究有懂CPU的么,看看这个江南所的申威1600如何
我们的龙芯3号---致龙芯15周年 (转载)很强大的圣诞树
我的存储解决方案intel ssd 完蛋了
[合集] 电源不好就是不行3TB外置硬盘,选seagate GoFlex Desk还是西部数据Book Essential 3T?
[合集] these 3 sata HDs are recommeded by Tomhardware请教电脑大牛-我哪里做的不对了 (转载)
Hurry - hot hard drive western digital 640 gb $38终于把pogoplug E02刷好debian,装好transmission了
相关话题的讨论汇总
话题: 申威话题: 神威话题: 超算话题: cpu话题: 龙芯
进入Hardware版参与讨论
1 (共1页)
c*m
发帖数: 1599
1
【 以下文字转载自 Military 讨论区 】
发信人: cym (纯爷们), 信区: Military
标 题: 相比龙芯,申威的“芯”路历程为什么平坦很多?
发信站: BBS 未名空间站 (Fri Oct 2 15:25:49 2015, 美东)
10月2日,雷锋网刊登专栏作者铁流的文章《相比龙芯,申威的“芯”路历程为什么平
坦很多?》,试图解密一款因军方背景而带有神秘色彩的全自主芯片——申威。全文如
下:
相对于从诞生之初就处于舆论风口浪尖的龙芯,国内另一款走全自主道路的芯片——申
威,相比之下就低调得多。无论是传统纸媒还是网络媒体,申威的曝光率比起龙芯、海
思、展讯等国产芯片都要低得多,而且相比于嘲讽天赋技能被点满的龙芯,申威极少成
为网媒和充满虐气的网民的攻击对象。
申威的军方背景更是给它带一缕神秘的色彩。下面,让我们一起走进申威,解密申威的
“芯”路历程。
1、申威的诞生
上世纪60-70年代末,中国在高性能计算机领域也曾有过自己的辉煌——哈军工曾经制
造出具有分时操作系统和汇编语言、FORTRAN语言及标准程序库的441B系列计算机。北
京大学、北京有线电厂等单位联合研制150计算机。清华大学、北京无线电三厂研制生
产了130、131、132、135、140、152、153系列计算机近千台。国防科大成功研制出151
计算机,华东计算技术研究所成功研制1001中型集成电路计算机和HDS-9计算机,其中
HDS-9计算机每秒运算达500万次,更为难能可贵的是,这些计算机的软件和硬件是中国
人自己编译和制造的。
但在80年代因迷信“造不如买、买不如租”、“市场换技术”等理论,放弃了自主芯片
的研发转而大量外购国外芯片。从80年代的银河1超算开始,到90年代的银河2、银河3
,曙光系列超级计算机都没有中国“芯”,在技术上始终受制于人。即使是在几年前的
天河2号上,也只有4096片飞腾1500作为计算节点前端处理器,而飞腾1500是在SUN的
UltraSPARC T2基础上做的改进版本。
为解决在超算和国防、信息安全无“芯”可用的困境。总参谋部第五十六研究所(无锡
江南计算技术研究所)于2003年开始着手设计中国人自己的高性能芯片。申威从此踏上
了征途。
超云申威服务器
2、申威的娘家
申威由总参谋部第五十六研究所(无锡江南计算技术研究所)设计,上海高性能集成电
路设计中心是56所的马甲。
该研究所创建于1951年6月,坐落于无锡。主要研究方向有计算机系统结构、并行/分布
处理与智能计算机系统、计算机软件、人工智能与智能控制、计算机与通信、计算机信
息处理与应用。八十年代以来,在计算机、通信及机电一体化等领域共荣获国家、军队
科学技术成果奖300多项,其中国家科学技术进步特等奖3项,军队科学技术进步一等奖
35项。1987、2000年,中央军委两次为56所荣记集体一等功。1993年中央军委授予56所
“勇攀科技高峰先进研究所”荣誉称号。
瘦客户端
3、申威的指令集和技术渊源
申威属于Alpha阵营,指令集也是基于Alpha进行扩展。
申威的技术来源是于DEC的Alpha 21164。DEC的技术实力很强,Alpha性能更是惊艳,
AMD就曾经购买了Alpha 21264的技术资料,挖走了部分DEC的技术人员后,开发出自己
的K7微结构。
DEC是技术实力比人强,但商业模式不如人而失败的典型例子,Alpha也被几经转手,先
被康柏收购,后被惠普雪藏。目前Alpha已经被束之高阁,指令集和微结构都已经不再
更新,技术专利大多已过期或快过期了。申威是目前Alpha阵营中仅存的硕果,拥有自
主扩展指令和发展路线的自主权。
至于购买国外指令集,并以此为基础扩展指令,发展出自己的指令集是否是自主可控等
问题,请参见本人撰写的另一篇文章《15年了,龙芯拿什么与国外芯片巨头对抗》。
防火墙
4、自主可控体系构建
申威和龙芯作为国内硕果仅存的两个走自主可控路线的IC设计单位,和龙芯一样在积极
构建自己的软硬件体系以保障从软件和硬件两个方面实现安全可控。
申威开发了自己的神威睿智编译器,研发了基于Linux的神威睿思操作系统。加上超算
领域不像PC领域那样存在软件生态的掣肘,申威构建自主技术体系的道路可谓一片坦途
——于2012年9月投入使用的神威蓝光超算使用了8704片申威1600,搭载神威睿思操作
系统,实现了软件和硬件全部国产化。
5、申威历程
56所(江南所)以Alpha指令集为基础,扩展出自己的指令集,并在2006年设计出具有
自主微结构的申威1,申威1是一款130nm制程工艺的单核心CPU,主频900MHz,集成5700
万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。
如果说申威1和申威2更像是56所磨砺技艺的作品,是对Alpha21164技术的消化吸收,那
么2010年研发的申威1600则是56将国外技术融会贯通后,推陈出新的产品。申威1600是
一款65nm制程工艺的16核CPU,主频1.1G,双精浮点140G。申威1600被用于神威蓝光超
算。
也许是因Alpha当年强悍的性能,本人对源自Alpha的申威抱有很高的期望。但根据国家
高性能集成电路设计中心公布的论文显示,申威1600的SPEC2000测试分数只能说是差强
人意,唯有性能功耗比和 LINPACK测试聊以自慰。
平心而论,虽然申威1600处理器的单核性能有限,但16核的可扩展性很好,实现了比较
理想的多核性能加速比。
申威1600性能参数如下图所示:
2012年,56所研制出申威1610和申威410,申威1610为40nm制程的16核CPU,集成10亿晶
体管,主频1.6G,最大功耗50W,双精浮点运算200G。申威410为40nm制程的4核CPU,集
成2.7亿晶体管,主频1.6G。前者用于服务器,后者用于PC,支持中标麒麟操作系统。
这两款产品同样遭遇了龙芯在PC市场遇到的软件生态贫乏和产业联盟弱小导致产品缺乏
市场竞争力的困境,加上申威410单核性能太弱,搭载申威410的安全可信PC基本不具备
在民用PC市场的竞争力。
2014年底,申威5成功流片。根据一篇由坐落于无锡的数字工程与先进技术国家重点实
验室和坐落于北京的国家并行计算机工程技术研究中心联合发布的论文,申威5很有可
能是一款集成了4个管理核心和256个运算核心的高性能众核CPU,双精浮点运算超过1T
,核内 linpack效率93%,并有很高的性能功耗比。
申威5结构图
6、神威蓝光超算
神威蓝光超算总投资6亿元,于2012年9月投入使用。神威蓝光超级计算机使用了8704片
申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。神威蓝光超算峰值
计算性能1PFlops(一千万亿次每秒),持续性能为0.796PFlops,性能功耗比超过
741MFlops/W(百万次浮点运算/秒•瓦),LINPACK效率为74%。
神威蓝光超算有以下特点:
一是全部使用申威1600芯片,搭载神威睿思操作系统,实现软件和硬件全部国产化;
二是稳定性较好,测试Linpack 全过程9个多小时无故障;
三是液冷系统高效可靠,冷却剂在冷板内部的封闭水循环带走主板热量,环保且无噪音;
四是高密度封装,一个机仓可装入1024个CPU;
五是整机功耗低,性能功耗比高。神威蓝光超算性能功耗比超过741MFlops/W,整机功
耗1W;天河1号超算性能功耗比431.7 MFlops/ W,整机功耗4W。
六是整机效率高。神威蓝光超算LINPACK在不同规模下的效率:单处理器核80.28%,单
CPU 75.20%,单机舱75.07%,整机74.37%。神威蓝光超算整机效率与曾经是美国最快的
计算机美洲虎超级计算机效率相当。
据统计,“国家超级计算济南中心”有注册用户超过100个,移植优化60多道重点应用
课题,其中能够达到上万核并行规模的应用课题达16个,有应用成果的课题超过15个,
系统利用率已超过60%。目前主要面向气象气候、海洋环境、生物医药、信息安全、航
空航天、材料物理、金融分析、工业设计、石油物探等应用领域。
新一代神威超算
无锡市人民政府于2013年就成立了以市长为组长,副市长为副组长的国家超级计算无锡
中心建设领导小组,积极筹备新一代神威超算建设。2015年4月,官方成立了无锡恒鼎
超级计算中心有限公司作为国家超级计算(无锡)中心的建设和运营主体,56所成立了
项目指挥组及总师组负责解决超算建设过程中的技术问题。
目前,新一代神威超算主机系统软件正在调试中,整机系统设计计划于2015年年底公布
。新超算总投资18亿元,计划在 2017-2018年建成,运算能力将达到100PFlops,计算
性能有望冲击世界第一。
神威MPP机
神威MPP机是国家并行计算机工程技术研究中心研制的面向千万亿级以上规模的高性能
计算机,能通过虚拟化技术、网格计算技术和云存储技术在服务层虚拟出多种计算和存
储服务形态。
神威MPP机硬件系统由高速运算系统、互连网络系统、海量存储系统、维护监控系统、
电源系统、冷却系统和结构组装设计等部分组成。软件系统主要包括“神威睿思”操作
系统、“神威睿智”编译器、基础库等。
系统投入使用以来,已经成功移植了包括气候气象、海洋科学、新药研制、生物信息、
航空航天、工业设计、金融分析等重点应用领域的近二十道万核以上并行规模的实际应
用课题,取得若干重大应用成果。
神威Cluster是在汇集神威MPP机的技术优点基础上,专门为科学和工程计算领域设计开
发的高性能计算平台。在气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基
因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、芯片设计、动漫设计
、工业设计等方面用途广泛。
神威Cluster系统的通用结构如下图:
7、安全可信PC
神威安全可信PC是搭载申威410,针对有较高安全需求的党政军单位,元器件实现100%
国产化。内嵌的国产外围套片,集成了符合国家标准的可信密码模块,实现系统内嵌式
可信引导和软件系统的可信度量,保证系统的安全可信。
因申威410单核性能太弱,软件生态极度贫乏,仅限于满足特殊部门使用。如果说龙芯
还是在从安全市场往民用市场方向发展的话,申威从头到尾压根就没考虑过民用市场,
完全是自己关起门来自己玩。
实事求是的说,搭载申威410的安全可信PC不仅价格贵,整机性能弱,而且软件生态贫
乏,基本不具备在民用PC市场的竞争力。
在申威5走众核路线后,从2012年至今,申威没有新的桌面芯片产品,很有可能已经放
弃桌面芯片开发。
安全架构如图所示:
8、神威云
神威云是国家并行计算机工程技术研究中心研发的云产品,能够提供丰富的云产品套件
、开放的API接口、全面的资源管理平台和运维监视平台,具有强大的虚拟资源池管理
能力。神威云平台采用商用服务器、高速网络、高性能存储设备,结合神威云平台系列
软件搭建。具有功能强大、性能稳定、安全可靠、简单好用的特点。
9、小结
虽然申威和龙芯一样是走独立自主路线,但申威的道路要比龙芯平坦得多:
首先,国家对龙芯的投入非常有限,而且龙芯自2010年市场化运营后完全自主经营,自
负盈亏。申威是军方项目,不仅不用面对IC设计公司最头痛的技术人才流失问题,还能
在人力物力财力可以得到军方充足保障。
其次,申威专注于超算领域,不存在龙芯在PC市场遇到的软件生态贫乏和产业联盟弱小
导致产品缺乏市场竞争力的困境。申威有自己的指令集、微结构、CPU、编译器、操作
系统就足以在超算领域立足。而龙芯则被软件生态贫乏和产业联盟弱小掣肘。但申威专
注于超算领域也带来一个缺憾,就是在和人民群众最息息相关的民用PC市场,我们可能
永远看不到申威的产品了。
最后,申威是军方项目,而神威超算更是国家级工程,申威的软件和硬件产品完全可以
在体制内完成内部循环。而龙芯的很多产品必须到商业市场上去拼杀。
申威自2003年诞生以来,基于Alpha自主扩展了指令集,共设计了申威1、申威2、申威
1600、申威1610、申威5五款芯片,自主研发了神威睿智编译器和神威睿思操作系统,
推出了搭载申威芯片的PC、服务器、高性能计算机、超算、防火墙、机架式存储服务器
、大规模集群存储系统、瘦客户端、QDR HCA卡、神威云等产品,为国家信息安全和超
算建设竭尽所能,圆满完成了国家交付的任务。
f****p
发帖数: 18483
2
手淫篇
n******7
发帖数: 12463
3
当年AMD难得几年风光就是靠了DEC的技术
加上阿三的P4
之后被PM及其子孙打得找不着北
s*******d
发帖数: 3991
4
这个运算能力相当于多少个 Titan GPU?
m**u
发帖数: 541
5
国人真tm有问题, 这种文章到底想说啥?
k***5
发帖数: 583
6
基于Linux源码改改,就变成自主开发的操作系统了。忽悠上级给钱而已。6个多亿砸了
下去,又忽悠了新超算总投资18亿元。做了个性能弱到无法在单机下使用的CPU。Linux
在200MHZ的CPU就跑的不错了。
g********x
发帖数: 7361
7
性能不用很强,比486强就行,可以用在导弹上修正弹道即可
c*m
发帖数: 1599
8
申威基于当年的alpha处理器,还行。
申威5效率和功耗都比NVidia Titan GPU强,还是CPU,已经不错了。
只是申威的单核性能确实不济(虽然性能每瓦不错),做个人使用的桌面电脑确实不行。
放君搞得几款处理器都还行,虽然借(tou)鉴(dao)了别人的设计,但是搞出来的
CPU不算差。例如郭芳科大搞得Sparc指令集CPU和ARMv8指令集CPU,都还可以。
郭芳科大最早是逆向山寨Intel的IA64体系处理器安腾,只是安腾CPU在市场上举步维艰
,这个逆向工程虽然成功了却不得不放弃(立项时迷信intel,没想到intel也有失误的
时候)。然后因为太阳微系统免费开放了Sparc的设计代码,于是郭芳科大就在Sun的设
计基础上改改,弄出了飞腾1500,用在天河2号巨星机的通信上。 (Sparc的特点是通
信很牛但是浮点性能不足。)天河2的主要计算节点还是靠intel的CPU。因为Sparc指令
集市小,所以放君又瞄向了ARM指令集。郭芳科大ARMv8指令集,四发射乱序执行,拥有
多达64个核心,主频达到2GHZ的服务器CPU的理论浮点计算能力是512G DP Flops,采用
28nm制造工艺,主频2GHZ,核心运行电压不足1v。虽然整个芯片面积达到了吓人的640
平方毫米,但是满载功耗只有120w,甚至 比使用22nm先进工艺,性能相当的Xeon E5-
2699v3都低一截。这款处理器据说要用到下一代天河上。同时郭芳科大的通用DSP芯片
Matrix2000也不错,做计算的话通用DSP芯片比GPU更好,dsp自己就是计算主体。
Matrix2000采用了标量与向量单元+超长指令字(VLIW),16核DSP设计,双精浮点运算
为2.4T,功耗比Xeon PHI低100w(Xeon PHI 双精浮点为1T, Matrix2000和第二代“
KnightCorner”双精浮点3T相比有差距,但性能每瓦值不错。) 因美帝禁售的Xeon
PHI,郭芳科大下一代天河计划的计划中,走GPDSP路线,用DPS芯片——Matrix2000 替
代Xeon PHI。
s*****e
发帖数: 16824
9
跟制程也有关系,现在中芯的28nm制程量产了,相关芯片的性能又可以上一大步。

行。

【在 c*m 的大作中提到】
: 申威基于当年的alpha处理器,还行。
: 申威5效率和功耗都比NVidia Titan GPU强,还是CPU,已经不错了。
: 只是申威的单核性能确实不济(虽然性能每瓦不错),做个人使用的桌面电脑确实不行。
: 放君搞得几款处理器都还行,虽然借(tou)鉴(dao)了别人的设计,但是搞出来的
: CPU不算差。例如郭芳科大搞得Sparc指令集CPU和ARMv8指令集CPU,都还可以。
: 郭芳科大最早是逆向山寨Intel的IA64体系处理器安腾,只是安腾CPU在市场上举步维艰
: ,这个逆向工程虽然成功了却不得不放弃(立项时迷信intel,没想到intel也有失误的
: 时候)。然后因为太阳微系统免费开放了Sparc的设计代码,于是郭芳科大就在Sun的设
: 计基础上改改,弄出了飞腾1500,用在天河2号巨星机的通信上。 (Sparc的特点是通
: 信很牛但是浮点性能不足。)天河2的主要计算节点还是靠intel的CPU。因为Sparc指令

c*m
发帖数: 1599
10
相信以后CPU群魔乱舞的时代会到来。
现在中国各种体系的CPU都在上马。
alpha (江南所)
x86 (威盛)
Sparc (郭芳可打)
power (苏州中晟宏芯)
ARM (华为、郭芳可打)
MIPS (计算所龙芯)

【在 s*****e 的大作中提到】
: 跟制程也有关系,现在中芯的28nm制程量产了,相关芯片的性能又可以上一大步。
:
: 行。

a9
发帖数: 21638
11
现在活的不错的也就是x86跟arm了吧

【在 c*m 的大作中提到】
: 相信以后CPU群魔乱舞的时代会到来。
: 现在中国各种体系的CPU都在上马。
: alpha (江南所)
: x86 (威盛)
: Sparc (郭芳可打)
: power (苏州中晟宏芯)
: ARM (华为、郭芳可打)
: MIPS (计算所龙芯)

x****u
发帖数: 12955
12

史上所有著名架构都将在中国满血复活。

【在 c*m 的大作中提到】
: 相信以后CPU群魔乱舞的时代会到来。
: 现在中国各种体系的CPU都在上马。
: alpha (江南所)
: x86 (威盛)
: Sparc (郭芳可打)
: power (苏州中晟宏芯)
: ARM (华为、郭芳可打)
: MIPS (计算所龙芯)

c*m
发帖数: 1599
13
今天有一篇为兆星洗地的新闻
http://www.ithome.com/html/it/183238.htm
1 (共1页)
进入Hardware版参与讨论
相关主题
终于把pogoplug E02刷好debian,装好transmission了我的存储解决方案
跳N54L的朋友,你们光驱咋接的?都用的 USB external么?[合集] 电源不好就是不行
where to buy hard disk rack for raid systems for cheap ?[合集] these 3 sata HDs are recommeded by Tomhardware
为啥EMC的存储那么NB??Hurry - hot hard drive western digital 640 gb $38
龙芯无奈购美公司专利授权 CPU自主产权战略失败 (ZT) (转载)能不能硬盘转化成RAID 0而不重装系统?
zzz: 龙芯与mips要买个2T的硬盘
FYI 中国龙芯CPU的调查与研究有懂CPU的么,看看这个江南所的申威1600如何
我们的龙芯3号---致龙芯15周年 (转载)很强大的圣诞树
相关话题的讨论汇总
话题: 申威话题: 神威话题: 超算话题: cpu话题: 龙芯