由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 问个很蠢的spark streaming问题
相关主题
coding test in Jive问一个twitter 问题
祝贺peking2升级成Staff & Tech Lead写Hadoop的code感觉和写一般code没啥大区别啊
storm和spark, maprduce比有什么优势?现在公司用storm的还多么?
也问一个最近版上G家的题求twitter内推
有做video streaming的前辈吗看到好多人骂scala
诚恳问个Bloomberg题目谁有个save protocolbuf class from spark streaming to cassandra的example?
storm俨然是下一个冉冉升起的新星啊 (转载)Hiring Lead Big Data Engineer, Graph Team
还有找工作的吗?LIVE: Wikileaks Julian Assange Press Conference 3/23/17 (
相关话题的讨论汇总
话题: api话题: tweet话题: spark话题: language
进入JobHunting版参与讨论
1 (共1页)
b**********5
发帖数: 7881
1
看了看documentation, examples, 都是些简单的basic operation, 比如count,
join, filter啊什么的。。。
我以前有个storm topology, 很多bolt, 其实就是一个asynchronous http call to
some other API。。。 但是在apache stream里,好像没有哪个transforming step是
能够asynchronous http call的?
比如我现在有这个
class Tweet {
id;
text;
language;
}
我现在tweet DStream, 要call 一个3rd party web API, 那个3rd party web api
要text, response会告诉我是什么language, 然后我save到Tweet class的language
field。
这个在apache spark里怎么搞啊?
b**********5
发帖数: 7881
2
那你不是傻逼的, 来回答啊。。。
h*******0
发帖数: 270
3
牛肉姐,这样行吗?
stream.map{asyncall}.map{
_ onSuccess {...}
}
如果3rd api很慢, 会导致memory不够。 spark 1.5以后有backpressure,用这个限制
流量吧。
1 (共1页)
进入JobHunting版参与讨论
相关主题
LIVE: Wikileaks Julian Assange Press Conference 3/23/17 (有做video streaming的前辈吗
问个guangyi的面试题诚恳问个Bloomberg题目
问个twitter 题storm俨然是下一个冉冉升起的新星啊 (转载)
你们公司python 主要做什么重要活还有找工作的吗?
coding test in Jive问一个twitter 问题
祝贺peking2升级成Staff & Tech Lead写Hadoop的code感觉和写一般code没啥大区别啊
storm和spark, maprduce比有什么优势?现在公司用storm的还多么?
也问一个最近版上G家的题求twitter内推
相关话题的讨论汇总
话题: api话题: tweet话题: spark话题: language