搞矩阵的竟然没有人提BLAS - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 搞矩阵的竟然没有人提BLAS

相关主题
● bit count in value from 0 - 255	● 水帖: EE目前最悲剧的方向
● [合集] 关于查内存泄露	● 纳米加工相关机械PhD 求内推
● 新人5个包子请教问题，redhat读写文件的内存问题 (转载)	● 被layoff急求内推
● 请问大家都用多大的显示器?	● PhD position at UIUC
● job opening: software engineer in bay area	● 纳米加工相关机械PhD 求内推
● 刚刚惊闻某同学是用matlab p图的	● Another R memory problem.
● 我作为外行对IC的理解

相关话题的讨论汇总
话题: 优化话题: 矩阵话题: blas话题: cache话题: sse

进入Programming版参与讨论

1

(共1页)

w***g 发帖数: 5958	1 最近本三层循环的矩阵乘法自然差不多，java做运行时编译，说不定还好点。你弄个AT LAS的矩阵乘法再来比比看？(懒的话就用matlab算你那个矩阵乘法, matlab用的就是AT LAS。）C的好处在于architecture dependent，可以做优化。C++的好处在于可以兼容C 。这种优化跟java的思想是背道而驰的。
t****t 发帖数: 6806	2 有人提了LAPACK啊. 当然乘法用不到LAPACK这么高, 确实BLAS就够了. AT AT 容C 【在 w***g 的大作中提到】 : 最近本三层循环的矩阵乘法自然差不多，java做运行时编译，说不定还好点。你弄个AT : LAS的矩阵乘法再来比比看？(懒的话就用matlab算你那个矩阵乘法, matlab用的就是AT : LAS。）C的好处在于architecture dependent，可以做优化。C++的好处在于可以兼容C : 。这种优化跟java的思想是背道而驰的。
c*******h 发帖数: 1096	3 blas能做最多优化的是level3的，像矩阵乘向量那种level2的能优化的地方不是很多，所以优势不会特别明显。尤其是很多优化针对的是硬件，例如说 cpu的架构，缓存的大小，所以不同机器测出来很不一样。现在有人研发java的blas库，就好像nvidia也搞自己的cublas库一样。看吧，随着软硬件的发展，谁比谁好还真的很难一锤定音。程序员很少去关心现成的库的实现，而恰恰是现成的库的效率给了程序员关于语言的效率的印象。有时候底层的库写好了，以及做了针对性的优化的话，整一门语言给程序员的感觉就很不一样了。 AT AT 容C 【在 w***g 的大作中提到】 : 最近本三层循环的矩阵乘法自然差不多，java做运行时编译，说不定还好点。你弄个AT : LAS的矩阵乘法再来比比看？(懒的话就用matlab算你那个矩阵乘法, matlab用的就是AT : LAS。）C的好处在于architecture dependent，可以做优化。C++的好处在于可以兼容C : 。这种优化跟java的思想是背道而驰的。
d****n 发帖数: 1637	4 SSE优化与否大不同吧。 jvm 都非常aggressive 的优化了。还有好多inline. 比较自己写的code 当然要十八班兵器全用上了。否则没有可比性。
w***g 发帖数: 5958	5 优化的是cache. 【在 d****n 的大作中提到】 : SSE优化与否大不同吧。 : jvm 都非常aggressive 的优化了。还有好多inline. : 比较自己写的code 当然要十八班兵器全用上了。 : 否则没有可比性。
d****n 发帖数: 1637	6 It is all about cache. 【在 w***g 的大作中提到】 : 优化的是cache.
t****t 发帖数: 6806	7 SSE其实没有那么神, 毕竟是线性的优化和BLAS这种算法的优化还是没法比的【在 d****n 的大作中提到】 : SSE优化与否大不同吧。 : jvm 都非常aggressive 的优化了。还有好多inline. : 比较自己写的code 当然要十八班兵器全用上了。 : 否则没有可比性。
t****t 发帖数: 6806	8 到底是all about cache还是all about sse? 【在 d****n 的大作中提到】 : It is all about cache.
n*****3 发帖数: 1584	9 I think it depends on the size of data and your MEM 【在 t****t 的大作中提到】 : 到底是all about cache还是all about sse?
t****t 发帖数: 6806	10 我知道是这样的, 我主要是觉得dryden一会儿一个说法【在 n*****3 的大作中提到】 : I think it depends on the size of data and your MEM
a****l 发帖数: 8211	11 of course cache. SSE is useless if the cache is not handled properly in the first place. 【在 t****t 的大作中提到】 : 到底是all about cache还是all about sse?

1

(共1页)

进入Programming版参与讨论

相关主题
● [合集] 关于查内存泄露	● 纳米加工相关机械PhD 求内推
● 新人5个包子请教问题，redhat读写文件的内存问题 (转载)	● 被layoff急求内推
● 请问大家都用多大的显示器?	● PhD position at UIUC
● job opening: software engineer in bay area	● 纳米加工相关机械PhD 求内推
● 刚刚惊闻某同学是用matlab p图的	● Another R memory problem.
● 我作为外行对IC的理解	● bit count in value from 0 - 255
● 水帖: EE目前最悲剧的方向

相关话题的讨论汇总
话题: 优化话题: 矩阵话题: blas话题: cache话题: sse

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)