由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - Hama是怎么一回事?
相关主题
2015年硅谷最火的高科技创业公司都有哪些?还有一周onsite,怎么看Hadoop.The.Definitive.Guide效率最高?
storm俨然是下一个冉冉升起的新星啊 (转载)Big data startup opportunity
求教machinelearning方面recommendation system的tech blog物理phd好迷茫啊
Career Path to G, F, AG家mapreduce一道题
Ancestry is hiring Data Scientist/Senior Data ScientistCloudera这个公司怎么样
Amazon试题算法G里面搞big data的是不是出来没市场?
hadoop面试和学习总结workday onsite面经,已挂
[hortonworks面经] senior hadoop engineer版上有谁了解FB Giraph team?
相关话题的讨论汇总
话题: hama话题: mapreduce话题: bsp话题: mahout话题: commit
进入JobHunting版参与讨论
1 (共1页)
A*********t
发帖数: 64
1
Hama是开源的Pregel,在HDFS上面做graph partition,然后通过message passing再做
local computation,周而往复,知道算出答案为止。抛弃了MapReduce。居然说在某些
方面比较MapReduce有优势。
那么,
比MapReduce有什么优势呢?他们吹嘘比Mahout算k-mean快很多。真的有这么一回事?
为什么那个project总是怪怪的。那个jira基本上是1个人在commit(!)是不是里面有
什么问题?基本上是:
1.我发现问题。
2.我给了patch。
3.我commit。
怎么没有些interactions?
为什么Mahout又那么火呢?不停有人刷mailing list,不停有人commit。
知道内幕的人说说?
j*******t
发帖数: 223
2
Hama是基于BSP计算框架的(Pregel和对应的开源版本Giraph也是基于BSP的)。BSP框
架在80年代由Leslie Valiant等人提出(2010年图灵奖得主)。与MapReduce相比,BSP
更适用于迭代式计算。
一个典型的基于BSP的程序分为多个iteration,其中每个iteration包含Local
computation,Communication,以及Synchronization这几个阶段(关于细节可以参看
相关网站)。
相较于专门针对Graph计算的Google的Pregel和另一个开源版本Giraph,Hama是一种更
加宽泛的计算框架,它有Grpah API,同时也可以大家写更加宽泛的迭代算法,比如
KMeans,EM,PageRank等。此外,为了进一步提高计算效率,Hama目前正在考虑加入
GPU协作运算。
另一个很接近的框架是Spark,如果数据(RDD)被载入内存(cache),那么Spark在进
行迭代运算时效率也很高。
Hama目前社区还很小,所以显得比较冷清。Mahout社区要大很多,而且目前在考虑加入
基于Spark的算法,所以比较热闹。
A*********t
发帖数: 64
3
谢谢!

BSP

【在 j*******t 的大作中提到】
: Hama是基于BSP计算框架的(Pregel和对应的开源版本Giraph也是基于BSP的)。BSP框
: 架在80年代由Leslie Valiant等人提出(2010年图灵奖得主)。与MapReduce相比,BSP
: 更适用于迭代式计算。
: 一个典型的基于BSP的程序分为多个iteration,其中每个iteration包含Local
: computation,Communication,以及Synchronization这几个阶段(关于细节可以参看
: 相关网站)。
: 相较于专门针对Graph计算的Google的Pregel和另一个开源版本Giraph,Hama是一种更
: 加宽泛的计算框架,它有Grpah API,同时也可以大家写更加宽泛的迭代算法,比如
: KMeans,EM,PageRank等。此外,为了进一步提高计算效率,Hama目前正在考虑加入
: GPU协作运算。

1 (共1页)
进入JobHunting版参与讨论
相关主题
版上有谁了解FB Giraph team?Ancestry is hiring Data Scientist/Senior Data Scientist
刚面完的2道题,我做的稀烂Amazon试题算法
merge two binary search treehadoop面试和学习总结
BSP/Linux/OMAP short term job (转载)[hortonworks面经] senior hadoop engineer
2015年硅谷最火的高科技创业公司都有哪些?还有一周onsite,怎么看Hadoop.The.Definitive.Guide效率最高?
storm俨然是下一个冉冉升起的新星啊 (转载)Big data startup opportunity
求教machinelearning方面recommendation system的tech blog物理phd好迷茫啊
Career Path to G, F, AG家mapreduce一道题
相关话题的讨论汇总
话题: hama话题: mapreduce话题: bsp话题: mahout话题: commit