为什么我这个笔记本比台式机快，算矩阵乘法 - Hardware版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Hardware版 - 为什么我这个笔记本比台式机快，算矩阵乘法

相关主题
● 那个ThinkCentre就一个i7-2600, 有啥可搞的, 不明白了	● 970想换个I7 4xxx的CPU combo
● 两块 Xeon E5-2687v3 CPU性能比一块 phi 5110p强啊	● 小型核弹爆了，要上e5 v3的赶紧
● ebay拍的T3500到了	● 这个ENVY 14的deal怎么样？
● 感觉品牌机不如自己攒的放心	● 看来Sandy Bridge类似当年的MMX
● 两百以下有比i7 2600更强的机子么？	● Sandy Bridge展望
● 吐槽一下刚买的dell Inspiron 台式机	● 想装一台台式机，请大家帮忙看看内存和处理器
● 请问i7 3770和4770有啥区别呢?	● 这个配置值么？
● i7 4800MQ比台式机i7 3770还快	● 装一个NAS，贴配置，求拍

相关话题的讨论汇总
话题: e5话题: openblas话题: cpu话题: veclib话题: binary

进入Hardware版参与讨论

(共1页)

P**H
发帖数: 1897

macbook pro i7-4750HQ CPU @ 2.00GHz， OSX，veclib／homebrew openblas(binary)
server E5-1650 v2 @ 3.50GHz，ubuntu 14.04 lts，openblas(stock binary)
我那numpy算随机3000x3000乘3000x3000。mac上0.4s，server上1.7s。完全没道理。从
tdp，主频，turbo，这个i7全线不如xeon。
难道是mac优化得好？或者ubuntu上那个openblas有问题？
还有，就在mac上，openblas和veclib在这个大矩阵乘法差不多，但是eigen，svd那些
，veclib都快一些。这也是mac优化得好？

l*******m
发帖数: 1096

你可以看numpy到底用了什么blas

binary)

【在 P**H 的大作中提到】

: macbook pro i7-4750HQ CPU @ 2.00GHz， OSX，veclib／homebrew openblas(binary)
: server E5-1650 v2 @ 3.50GHz，ubuntu 14.04 lts，openblas(stock binary)
: 我那numpy算随机3000x3000乘3000x3000。mac上0.4s，server上1.7s。完全没道理。从
: tdp，主频，turbo，这个i7全线不如xeon。
: 难道是mac优化得好？或者ubuntu上那个openblas有问题？
: 还有，就在mac上，openblas和veclib在这个大矩阵乘法差不多，但是eigen，svd那些
: ，veclib都快一些。这也是mac优化得好？

P**H
发帖数: 1897

的确都是用的openblas。我查过了。再说，如果是用的非优化的blas，2s之内肯定算不
完的。

【在 l*******m 的大作中提到】

: 你可以看numpy到底用了什么blas
:
: binary)

n***d
发帖数: 8857

用了gpu？

binary)

【在 P**H 的大作中提到】

d***a
发帖数: 13752

E5-1650支持AVX，i7-4750支持AVX2。AVX/AVX2是向量指令集扩展。AVX2把寄存器宽度
从AVX的128位扩充到了256位，并且增加了新的指令，特别是FMA。对能用上向量处理的
程序来说，这些差别是挺大的。
Intel这个blog提了一些数据，见图。
https://embedded.communities.intel.com/community/en/software/blog/2013/08/01
/avx-20-enables-faster-image-and-signal-processing

binary)

【在 P**H 的大作中提到】

h******n
发帖数: 2795

我正准备从E5-1620v2升级到E5-1650v2，请楼主不要打击我。
很想直接升级到E5-1660v2,但是，E5-1660v2价格实在是太贵了～～

h******n
发帖数: 2795

即使是单线程工作，似乎E5-1650v2也不会比i7-4750HQ慢～
何况E5-1650v2是12线程，而i7-4750HQ是8线程～～
一种例外是：楼主使用的openBLAs在MACBook PRO（或编译中已经辨识了4750HQ CPU）
上编译过，且是多线程运行。而这个库在E5－1650v2上未编译（或预编译的库并没有包
括1650v2 CPU），使用的是单线程工作模式。

l*******m
发帖数: 1096

我的cpu是 1650V3，同样的测试是0.21s. 我的 openblas和numpy 都是从src编译安装的

【在 P**H 的大作中提到】

: 的确都是用的openblas。我查过了。再说，如果是用的非优化的blas，2s之内肯定算不
: 完的。

l*******m
发帖数: 1096

不是os的差别，是compilers的差别，clang比gcc是优化的好些。
http://www.phoronix.com/scan.php?page=article&item=clang-37-gcc

binary)

【在 P**H 的大作中提到】

d***a
发帖数: 13752

E5-1650和E5-1650v2支持AVX，E5-1650v3支持AVX 2.0.
编译优化对性能来说很重要，但gcc和clang不会有这样大的差别。

相关主题
● 吐槽一下刚买的dell Inspiron 台式机	● 970想换个I7 4xxx的CPU combo
● 请问i7 3770和4770有啥区别呢?	● 小型核弹爆了，要上e5 v3的赶紧
● i7 4800MQ比台式机i7 3770还快	● 这个ENVY 14的deal怎么样？
进入Hardware版参与讨论

r***i
发帖数: 913

1660v2的hp z420，ebay上刚有$850卖掉的
1660v3的DELL T5810，ebay上刚有$1146卖掉的
不要盯着cpu，直接关注整机
E5 V4也很快就来了

【在 h******n 的大作中提到】

: 我正准备从E5-1620v2升级到E5-1650v2，请楼主不要打击我。
: 很想直接升级到E5-1660v2,但是，E5-1660v2价格实在是太贵了～～

h******n
发帖数: 2795

eBay上单单E5-1660v2就要800刀～
1660v3的DELL T5810，$1146,如果我看到，就直接拿下了。但是，1660v3好像不如
1660v2. 相对1660v3来说，我更喜欢1650v3.
实在等不了v4,眼下有繁重simulations，急需升级CPU。

【在 r***i 的大作中提到】

: 1660v2的hp z420，ebay上刚有$850卖掉的
: 1660v3的DELL T5810，ebay上刚有$1146卖掉的
: 不要盯着cpu，直接关注整机
: E5 V4也很快就来了

P**H
发帖数: 1897

我觉得可能是Ubuntu上那个openblas没有优化好。我自己编译一下试试。

【在 d***a 的大作中提到】

: E5-1650和E5-1650v2支持AVX，E5-1650v3支持AVX 2.0.
: 编译优化对性能来说很重要，但gcc和clang不会有这样大的差别。

r***i
发帖数: 913

很多时候卖品牌机的，1660v2这种关键字写在了内容里，所以低价成交的事情常有
不过刚找出来关注过的那个z420，还真不是以上情况
http://www.ebay.com/itm/191777757628
DELL T5810那个
http://www.ebay.com/itm/Dell-Precision-Tower-5810-PC-E5-1660-v3-3-0GHz-16GB-256GB-SSD-Win-8-1-USED-/231820158506?
留心关注下品牌机，总有意外收获的，不过就是得每天看着点。上面这两个属于1-2个
月一遇得deal

【在 h******n 的大作中提到】

: eBay上单单E5-1660v2就要800刀～
: 1660v3的DELL T5810，$1146,如果我看到，就直接拿下了。但是，1660v3好像不如
: 1660v2. 相对1660v3来说，我更喜欢1650v3.
: 实在等不了v4,眼下有繁重simulations，急需升级CPU。

r***i
发帖数: 913

还有$2000出头的双E5 2663 V3 (DELL T7910)，这个是OEM CPU，Intel Ark里没有。
10核10线程，没有超线程，所以主频可以稍微高点。按搜2x 2663 v3就出来了

【在 h******n 的大作中提到】

h******n
发帖数: 2795

那台HP真是不错的deal。仅E5-1660v2 CPU就要750－800刀～～

【在 r***i 的大作中提到】

: 还有$2000出头的双E5 2663 V3 (DELL T7910)，这个是OEM CPU，Intel Ark里没有。
: 10核10线程，没有超线程，所以主频可以稍微高点。按搜2x 2663 v3就出来了

h******n
发帖数: 2795

费了老大的力气，今天花1200大洋(通过私下交易，节省340刀（1540－340）)，搞定一
台 T5810, E5-1650v3, AMD FirePro™ W7100。其实，显卡对我来说，一点不重
要。我主要用来做numerical simulations。

【在 r***i 的大作中提到】

: 还有$2000出头的双E5 2663 V3 (DELL T7910)，这个是OEM CPU，Intel Ark里没有。
: 10核10线程，没有超线程，所以主频可以稍微高点。按搜2x 2663 v3就出来了

x******r
发帖数: 538

连续算100次3000x3000乘3000x3000，把总计算量加长再比较比较准。

o**o
发帖数: 3964

用intel自己的blas库了吗？好像叫MKL。我老从前搞研究的时候用过，比自己编译的做
SVD轻松快好几倍。

P**H
发帖数: 1897

目前mac的veclib，mkl，和openblas差不多快的。

【在 o**o 的大作中提到】

: 用intel自己的blas库了吗？好像叫MKL。我老从前搞研究的时候用过，比自己编译的做
: SVD轻松快好几倍。

相关主题
● 看来Sandy Bridge类似当年的MMX	● 这个配置值么？
● Sandy Bridge展望	● 装一个NAS，贴配置，求拍
● 想装一台台式机，请大家帮忙看看内存和处理器	● AMD确实很差
进入Hardware版参与讨论

P**H
发帖数: 1897

GPU能用上也不错的。

【在 h******n 的大作中提到】

: 费了老大的力气，今天花1200大洋(通过私下交易，节省340刀（1540－340）)，搞定一
: 台 T5810, E5-1650v3, AMD FirePro™ W7100。其实，显卡对我来说，一点不重
: 要。我主要用来做numerical simulations。

y**b
发帖数: 10166

很多numerical simulations需要非常强大的后处理能力
此时专业显卡比cpu贵多了

【在 h******n 的大作中提到】

f*****i
发帖数: 835

Gpu应该更快些

【在 n***d 的大作中提到】

: 用了gpu？
:
: binary)

(共1页)

进入Hardware版参与讨论

相关主题
● 装一个NAS，贴配置，求拍	● 两百以下有比i7 2600更强的机子么？
● AMD确实很差	● 吐槽一下刚买的dell Inspiron 台式机
● 哪位专家给分析一下哪个更快，i5-3210M vs i7-720QM	● 请问i7 3770和4770有啥区别呢?
● 屌丝的近期比较失败的PC升级	● i7 4800MQ比台式机i7 3770还快
● 那个ThinkCentre就一个i7-2600, 有啥可搞的, 不明白了	● 970想换个I7 4xxx的CPU combo
● 两块 Xeon E5-2687v3 CPU性能比一块 phi 5110p强啊	● 小型核弹爆了，要上e5 v3的赶紧
● ebay拍的T3500到了	● 这个ENVY 14的deal怎么样？
● 感觉品牌机不如自己攒的放心	● 看来Sandy Bridge类似当年的MMX

相关话题的讨论汇总
话题: e5话题: openblas话题: cpu话题: veclib话题: binary

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天