n******7 发帖数: 12463 | 1 后面有个国人哥们儿朱印说:
Here are two examples I can share:
1. Matrix multiplication: I have a blog post comparing different matrix
multiplication implementations.
2. LBFGS
I have a large scale logistic regression solver using LBFGS optimization,
which is coded in C++. The implementation is well tuned. I modified some
code to code in C++/CLI, i.e. I compiled the code into .Net. The .Net
version is 3 to 5 times slower than the naive compiled one on different
datasets. If you code LBFGS in F#, the performa... 阅读全帖 |
|
g****t 发帖数: 31659 | 2 他说的有一定道理。现有成熟的矩阵库并不是单方面追求速度的。predictable 也很重
要。另外调用的over head改进下是可能的。
最后over all来讲, F#很快。编译型FP都不慢。
: 后面有个国人哥们儿朱印说:
: Here are two examples I can share:
: 1. Matrix multiplication: I have a blog post comparing different
matrix
: multiplication implementations.
: 2. LBFGS
: I have a large scale logistic regression solver using LBFGS
optimization,
: which is coded in C . The implementation is well tuned. I modified
some
: code to code in C /CLI, i.e. I compiled ... 阅读全帖 |
|
o**o 发帖数: 3964 | 3 扯蛋的事。。
多半是Fortran或者C++参考编译器设置有问题或者没有用新CPU特性,比较不公平 |
|
g****t 发帖数: 31659 | 4 最大的可能是:
他知道自己要做的计算。
通用库的assumption与此不同。
: 扯蛋的事。。
: 多半是Fortran或者C 参考编译器设置有问题或者没有用新CPU特性,比
较不公平
|
|
n******7 发帖数: 12463 | 5 但是也有可能是吹牛B不是?
如果不是成名的人物,我还是觉得assume是吹牛B比较可靠?
比较真牛B是小概率事件,不然不符合牛B的定义了 |
|
x****u 发帖数: 44466 | 6 提起网银,现在他微博删空blog近况也都删了,什么情况 |
|
n******7 发帖数: 12463 | 7 对于自己精通的领域,自然有能力判断高下
也看过很多烂事,知道不能盲目葱白
但是对于不熟悉的东西还是要看人的
网络上鱼龙混杂,看人是个提高信噪比的有效方法
比如就这个版面,有些ID粗看说的很牛x的样子
知道有一天你看到他一个帖子,只想说WTF
以后就可以省时间了 |
|
g****t 发帖数: 31659 | 8 人太复杂了。incredible 的复杂。
我的一点浅见:
做技术时间长了,技能到了一定程度,自然会只看技术。因为一般人那点粗浅的看人的
本事,
迟早是
相对于技术能力可以忽略不计。
: 对于自己精通的领域,自然有能力判断高下
: 也看过很多烂事,知道不能盲目葱白
: 但是对于不熟悉的东西还是要看人的
: 网络上鱼龙混杂,看人是个提高信噪比的有效方法
: 比如就这个版面,有些ID粗看说的很牛x的样子
: 知道有一天你看到他一个帖子,只想说WTF
: 以后就可以省时间了
|
|
w***g 发帖数: 5958 | 9 我不同意NT的性能比Linux有先天优势。
正规军要操心的事情太多,在性能上有先天的劣势。
比如NT内核和API分离,在内核外面搞win32子系统,os/2子系统,posix子系统,
各种机制与策略分离,像前面讨论的要开放各种钩子允许打补丁,
背负的东西太多太多了。
其实前两天讨论的MKL和手写代码在特定扁长形矩阵上的性能对比也是这回事。
Linux现在也是屠龙骑士变成龙了。引用你一句话: "但Linux最近20年加上无数肮脏补
丁后二者性能没有明显差异了。"
哥几个真是不易,老邢这坛子烂成这样,还是不离不弃,一上线了就过来回帖。
给自己点个赞!
Ubuntu |
|
发帖数: 1 | 10 看你处理数据什么意思,读写还是计算。io bound不用在乎真假线程,cpu bound库用
其他语言写,比如mkl就是多线程的。cython也可以release gil |
|
g****t 发帖数: 31659 | 11 你堆这些buzz word 毫无意义。任何人只要买个 C compiler,就可以写个更快的exp.
这个没你想的那么神奇。你手机里说不定就在跑我以前写的exp. 需要啥execution
engine ?
Nvidia 还有很多别的公司都有自己的inference软硬件工具链。国内也会有自己的。
inference也好,训练也好,乘法也好,exp也好.
这些问题和你讲的intc, goog的项目没有必然的
关系。
你的问题就是把一些公司的商标,看作要解决的问题本身。
就算是商标。你说的也不对。說不定明年阿里巴巴就出一套
IoT计算的SDK。你哭着说人家不是MKL吗?
: 你這又是胡說八道,cuBLAS需要GPU,inference性能比Intel AVX512
VNNI差遠
了。
: 圖像識別不是training,不需要加速卡也能用vector搞定。GPU處理的
latency大
得很,
: 根本不必要。
: 再說CUDA現在不支持bfloat16,哪年支持不一定。你牛逼自己寫
execution
engine,有
: 編譯器支持麼?
阅读全帖 |
|
|
|
x*****u 发帖数: 3419 | 14 【 以下文字转载自 Programming 讨论区,原文如下 】
发信人: xiaozhu (體育用品), 信区: Programming
标 题: Re: [转载] 关于c++,class 和 计算效率
发信站: Unknown Space - 未名空间 (Wed Aug 25 10:10:42 2004) WWW-POST
I googled, but didn't get the right place....
haha, good news. just found it. it's free!
check it out!
http://www.intel.com/software/products/mkl/noncom.htm
this
version.
your |
|
x*****u 发帖数: 3419 | 15 math.h 不行么?
或者intel 的 mkl.
linux 下免费。 |
|
t*********r 发帖数: 8 | 16 yeah, except from putting on a MKL coat, what else is it different from a BLAS
, LAPACK, FFT manual? gee, what a f**king waste |
|
|
w***n 发帖数: 1137 | 18 depends on what kind of CPU you are using. |
|
k******n 发帖数: 35 | 19 numerical reciepes sucks! Its purpose is to teach you algorithms. It has the
most terrible performance. But a lot of people are using it. gsl could be
much much faster, if you compile it correctly!
Try to compile your gsl using MKL (not free) or ATLAS. |
|
g****y 发帖数: 199 | 20 这种类型的问题原因很多, 最好把问题描述的详细一点,把编译的信息提示什么的都贴
上来,不然大家很难分析. |
|
w***n 发帖数: 1137 | 21 看manual, that is the best way. |
|
a**a 发帖数: 416 | 22 速度取决于两个因素: 底层blas库,和稀疏矩阵的节点重排算法。Matlab这两者
几乎都是最好的(intel的MKL和最优的节点重排算法之一)。搞清楚这两个你才
可以超越Matlab. 否则你还是用回Matlab吧。 |
|
k******n 发帖数: 35 | 23 gsl用的是dense algorithms。在matlab里,如果你的矩阵是稀疏的,matlab会调用
umfpack来求解。即使对稠密矩阵,gsl也有可能比matlab慢,因为matlab用intel的
LAPACK。由于技术的原因,gsl还没有办法把LAPACK封装在其中,接口是主要的问题。
对于单纯的矩阵计算,超越matlab的效率是很难的。Actually, you are competing
with Intel's MKL and Tim Davis' UMFPACK. |
|
a**a 发帖数: 416 | 24 不错.即使是稀疏矩阵计算, 里面使用的实际上是分块稀疏矩阵算法, 每一小块
又使用稠密的矩阵算法, 调用的是底层blas库, matlab的情况就是MKL. 所以
底层的blas库对于稀疏矩阵计算的效率也是至关重要的。 |
|
|
k******n 发帖数: 35 | 26 Use ACML for free or buy Intel's MKL. |
|
l***o 发帖数: 390 | 27 what is the difference between the two? Which library to link if I want to
compile MPI programs? |
|
m*******1 发帖数: 58 | 28 1. 矩阵计算, 你可以用其它的函数库, 比如: BLAS, gotoBLAS, LAPACK, etc.
2. For non-commercial use, 你可以试试 Intel Fortran for Linux 和 MKL库, non-
commercial version is free. 生成的代码计算效率非常高. |
|
i****r 发帖数: 1803 | 29 Intel MKL.
Personal use, 30 days free |
|
d******u 发帖数: 1142 | 30 多谢了。
请问LFCDS, RNSET, RNNOR这几个routine 在MKL 里面有对应的function 么?应该怎么
用呢? |
|
|
f*****e 发帖数: 2992 | 32 mkl_lapack95.lib还是其他lib? |
|
|
a****p 发帖数: 6155 | 34 都liblaapack.a了,还export LD_LIBRARY_PATH,ldconfig (/etc/ld.so.conf) 干嘛
直接告诉地址不就得了。
OP用的啥lapack? atlas,MKL,还是acml? |
|
H**********k 发帖数: 224 | 35 check out intel cpp compiler + ipp +mkl |
|
|
|
y*****y 发帖数: 98 | 38 intel MKL library
imsl library
but i think they are commercial and not free :( |
|
f***a 发帖数: 329 | 39 intel MKL library 不free吗?应该是free吧
有没有statistics的library,就是包括些distribution random generater,pdf、cdf
计算
之类的library,都要自己写太麻烦了点 |
|
y*****y 发帖数: 98 | 40 they are included in MKL.
Vector Statistical Library (VSL)
Summary Statistics Library (SSL) |
|
f***a 发帖数: 329 | 41 哦,我以为MKL也只是个加速linear algebra运算的library... |
|
G*****7 发帖数: 1759 | 42 google intel mkl
google blas
google linpack |
|
l****i 发帖数: 398 | 43 如果嫌麻烦自己装open blas什么的, 可以直接装一个revolution r open. RRO自带
Intel Math Kernel Library (MKL)可以multi-thread矩阵运算。我用的i5-3320m, 16g
内存,只能2个线程,速度也还行。
> if(require(RevoUtilsMath)){
+ setMKLthreads(2)
+ }
Loading required package: RevoUtilsMath
>
> a = matrix(rnorm(2000*2000), nrow=2000)
> b = matrix(rnorm(2000*2000), nrow=2000)
>
> system.time(a %*% b)
user system elapsed
0.92 0.00 0.52 |
|
J**********r 发帖数: 508 | 44 我是自己装的python27,所以得自己就一个个装库。目前装scipy时遇到困难,好像要
先装MKL, 一个C和Fortran的库,不知怎么搞。
不太想装这种free distribution什么都有的python。
by |
|
N***i 发帖数: 2063 | 45 Best-Rated Financial Stocks Updated June 23, 2010
http://www.nasd100.com/2010/06/bestrated-financial-stocks-updated-june-23-2010.html
Ranking | Company (Ticker) | Average Rating Value | Average Rating
1 IRSA Inversiones Representaciones (ADR) (NYSE:IRS) 1.00 Strong Buy
2 Primus Guaranty, Ltd. (NYSE:PRS) 1.00 Strong Buy
3 China Life Insurance Company Ltd. (ADR) (NYSE:LFC) 1.00 Strong Buy
4 National Bank of Greece (ADR) (NYSE:NBG) 1.00 Strong Buy
5 HDFC Bank Limited (ADR) (NYSE:HDB) 1.00 ... 阅读全帖 |
|
N***i 发帖数: 2063 | 46 【 以下文字转载自 Stock 讨论区 】
发信人: ll111 (Stealth), 信区: Stock
标 题: Events and ERs for week Aug 9-13
发信站: BBS 未名空间站 (Sat Aug 7 22:26:20 2010, 美东)
Monday, Aug. 9
Scheduled for around noon: President Obama to deliver remarks at University
of Texas in Austin.
No data scheduled.
Tuesday, Aug. 10
House returns for one day to vote on state aid bill.
9 a.m.: Federal Reserve's Federal Open Market Committee meets on interest
rate and monetary policy. Statement to be released at 2:15 p.m., at Fed
headquarters.
8... 阅读全帖 |
|