由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请问程序同时在多个cpu上运行需要怎么改程序?
相关主题
有没有玩CUDA的?并行程序能做到不用专门写么?
我写的CUDA屏保软件 (转载)请教,用什么并行化C#的程序,可以在Clusters上run
C++ Software Engineer 工作求内推(Boston)intel knights landing 72core CPU 谁用过?
请问该学点啥?谈谈想学好底层必不可少的东西
并行可以降低计算复杂度??nv的显卡能战胜intel的CPU么
我写的CUDA屏保软件-公开源码 (转载)没人讨论这个?
C#程序并行化问wdong一个问题,学习openGL从哪儿开始学好
招GPU工程师 (转载)如何查看一个程序/进程使用了哪些cpu?
相关话题的讨论汇总
话题: mpi话题: cpu话题: cluster话题: 程序话题: openmp
进入Programming版参与讨论
1 (共1页)
f**********0
发帖数: 1229
1
例如一个建模的程序,一个CPU+16个core可能也不够。
如果我有一个cluster,10个CPU,每个cpu16个core,我怎样能把这10个CPU同时用起来运
行我的这一个程序,这样就16*10=160个core效率就快了很多.
好像MPI也不能简单的做这个,1个cpu可以用OpenMP,多个呢?
是不是需要像GPU那样?多谢。
f**********0
发帖数: 1229
2
顶一下,没人知道吗?
s*****c
发帖数: 753
3
it is a cluster? so it must have MPI support.
If your program can be modified to use openmp, it can be modified to use MPI
. Same place to change.
However, it depends on your application whether cluster/mpi can help
improving the performance.

【在 f**********0 的大作中提到】
: 例如一个建模的程序,一个CPU+16个core可能也不够。
: 如果我有一个cluster,10个CPU,每个cpu16个core,我怎样能把这10个CPU同时用起来运
: 行我的这一个程序,这样就16*10=160个core效率就快了很多.
: 好像MPI也不能简单的做这个,1个cpu可以用OpenMP,多个呢?
: 是不是需要像GPU那样?多谢。

r**u
发帖数: 1567
4
If it is a cluster, then MPI should do it, why MPI can't do it?

【在 f**********0 的大作中提到】
: 例如一个建模的程序,一个CPU+16个core可能也不够。
: 如果我有一个cluster,10个CPU,每个cpu16个core,我怎样能把这10个CPU同时用起来运
: 行我的这一个程序,这样就16*10=160个core效率就快了很多.
: 好像MPI也不能简单的做这个,1个cpu可以用OpenMP,多个呢?
: 是不是需要像GPU那样?多谢。

d***a
发帖数: 13752
5
仔细读MPI编程手册... :-)
MPI是为并行处理设计的,用多处理器/多核没有问题
如果程序原来是单线程,要改写成MPI并行程序

【在 f**********0 的大作中提到】
: 例如一个建模的程序,一个CPU+16个core可能也不够。
: 如果我有一个cluster,10个CPU,每个cpu16个core,我怎样能把这10个CPU同时用起来运
: 行我的这一个程序,这样就16*10=160个core效率就快了很多.
: 好像MPI也不能简单的做这个,1个cpu可以用OpenMP,多个呢?
: 是不是需要像GPU那样?多谢。

q*******g
发帖数: 36
6
并行计算通常不是那么简单的事,方法也有多种,必须有针对的选择。
比较简单的是OPENMP,多个CPU可以用openmp
稍微复杂,但是自由度比较高的是MPI
http://www.amazon.com/Using-MPI-2-Scientific-Engineering-Comput
还有选择是GPU
楼主最好先去找个并行计算的教程来看看。
先把基本概念搞清楚再说。
f**********0
发帖数: 1229
7
多谢多谢
p*****2
发帖数: 21240
8
用akka怎么样?
v***r
发帖数: 1046
9
needs parallel programming, and it is not trivial work, the performance
depends on your algorithm, and the speedup is usually less than linear.

【在 f**********0 的大作中提到】
: 例如一个建模的程序,一个CPU+16个core可能也不够。
: 如果我有一个cluster,10个CPU,每个cpu16个core,我怎样能把这10个CPU同时用起来运
: 行我的这一个程序,这样就16*10=160个core效率就快了很多.
: 好像MPI也不能简单的做这个,1个cpu可以用OpenMP,多个呢?
: 是不是需要像GPU那样?多谢。

x****l
发帖数: 266
10
有GPGPU的话,推荐用CUDA并行其中主要一两个模块试试,
如果非要用cluster,那MPI最好,如果嫌不好改,可以试试UPC

【在 f**********0 的大作中提到】
: 例如一个建模的程序,一个CPU+16个core可能也不够。
: 如果我有一个cluster,10个CPU,每个cpu16个core,我怎样能把这10个CPU同时用起来运
: 行我的这一个程序,这样就16*10=160个core效率就快了很多.
: 好像MPI也不能简单的做这个,1个cpu可以用OpenMP,多个呢?
: 是不是需要像GPU那样?多谢。

O*******d
发帖数: 20343
11
用OpenCL运行在GPU上。 NVidia和AMD都支持OpenCL。 根据你的图卡的等级程度,
OpenCL做浮点计算可以比CPU做浮点计算要快百倍。
1 (共1页)
进入Programming版参与讨论
相关主题
如何查看一个程序/进程使用了哪些cpu?并行可以降低计算复杂度??
MPI 编程可以再 (转载)我写的CUDA屏保软件-公开源码 (转载)
OpenMP能编译产生DLL吗?C#程序并行化
哪位帮忙看一个极为简单的 MPI 程序,感谢拉!招GPU工程师 (转载)
有没有玩CUDA的?并行程序能做到不用专门写么?
我写的CUDA屏保软件 (转载)请教,用什么并行化C#的程序,可以在Clusters上run
C++ Software Engineer 工作求内推(Boston)intel knights landing 72core CPU 谁用过?
请问该学点啥?谈谈想学好底层必不可少的东西
相关话题的讨论汇总
话题: mpi话题: cpu话题: cluster话题: 程序话题: openmp