第8页 - 关于kafka的讨论汇总 - 话题女王

f*******r
发帖数: 976

来自主题: JobHunting版 - 回报本版，前段时间骑驴找马FGU等公司offer面经总结【已更新FGU】

恭喜，都是好包袱！

关键字: 面经
发信站: BBS 未名空间站 (Sat Jun 13 17:27:31 2015, 美东)
前段时间骑驴找马终于告一段落，感觉本版的技术贴和面经贴帮助非常之大，也非常感
谢共享资源的各路大牛。希望提供一些信息和个人感受给还在找工的童鞋，有帮助最好
，但是毕竟本人资历尚浅，如果有不对的地方也请轻喷。
背景：
ms毕业不到两年
主要申请公司：
offer：facebook，google，uber，palantir，sumo logic，walmartlab，yahoo，
amazon，apple
reject：dropbox
主要几个包裹：
U： 145k base + 25k股 RSU
F： 150k base + 40k signon + 10%bonus + 260k美元 RSU
W： 165k base + 50k signon + 20%bonus + 35k美元 RSU每年（
这个略复杂，相当于每年35k美元RSU的refres... 阅读全帖

b*****n
发帖数: 618

来自主题: JobHunting版 - beanbun 大牛给讲讲设计题你怎么回答的吧？

比如z-like order
不用很复杂。。。这个应该是他们还没做的东西，
面试的时候不用指望这种细节都很完美吧，没搞过geo的恐怕都需要回去查查资料大概
需要怎么做。
前面需要service tier把不同的event stream到Kafka，然后storm只是based on time
和geo hash做aggregation，可以提供不同的granularity，然后把结果存到任何一个
database或者kv store就行了。

g*****g
发帖数: 34805

来自主题: JobHunting版 - 再来继续比较，芒果和redis各什么时候用比较好？

Kafka does exactly that. But you can't avoid data loss during partition, in
other words, availability is sacrificed. There's no silver bullet.

t*********r
发帖数: 387

来自主题: JobHunting版 - 再来继续比较，芒果和redis各什么时候用比较好？

Kafka's ISR together with its f failure tolerance in f+1 nodes is a bad
guarantee, which is why data can be lost.

availability

p****6
发帖数: 724

来自主题: JobHunting版 - 报几个offer

cassandra, HDFS, Zookeeper, Kafka, Storm 读懂documentation 通吃。排名分先后
：）

s********l
发帖数: 998

来自主题: JobHunting版 - 亚麻面筋－－已挂

这么多设计题啊。。。
面的什么level啊？
第一个设计类似育kafka?
第三轮类似于 time vector?
请教第五轮你怎么设计的
interviewer怎么guide的？
谢谢

S*******r
发帖数: 14

来自主题: JobHunting版 - Uber总部Big Data / 大数据组急招engineers

我在Uber Data Infrastructure组做hiring manager，现在开始为下半年招人，
backend engineer, full stack engineer, DevOps都要，名额充足。只要有Hadoop/
Kafka/Samza/Storm/Spark/Memsql/Riak/Hbase/Vertica相关经验，或者类似的系统（
例如狗家的码工）的同学都欢迎投。
工作地点在总部San Francisco, Uber支持H1B和Greencard (EB1-B（符合条件者）和
EB2都可）
版上的同学如果有兴趣，请投简历到 [email protected]
/* */，这个email我亲自查
看，保证每个简历我都会看一遍。合适者立即电面。

G*****m
发帖数: 5395

来自主题: JobHunting版 - Uber总部Big Data / 大数据组急招engineers

大牛能说说这些狗家对应的都是啥吗？
Hadoop/Kafka/Samza/Storm/Spark/Memsql/Riak/Hbase/Vertica
hadoop是mapreduce？
其他的呢？

e********3
发帖数: 229

来自主题: JobHunting版 - Uber总部Big Data / 大数据组急招engineers

就会hadoop. hbase/kafka/storm学过但是工作不用...也写不到简历上...可以投贵组
backend职位么?

b**********5
发帖数: 7881

来自主题: JobHunting版 - Uber总部Big Data / 大数据组急招engineers

我就知道hadoop， kafka， storm， hbase， spark知道是干嘛。。。没用过

p****w
发帖数: 90

来自主题: JobHunting版 - Uber总部Big Data / 大数据组急招engineers

zan nn【在 Starpower (喵)的大作中提到：】n：n：我在Uber Data Infrastructure
组做hiring manager，现在开始为下半年招人，n：backend engineer, full stack
engineer, DevOps都要，名额充足。只要有Hadoop/n：Kafka/Samza/Storm/Spark/
Memsql/Riak/Hbase/Vertica相关经验，或者类似的系统（n：例如狗家的码工）的同学
都欢迎投。n：n：工作地点在总部San Francisco, Uber支持H1B和Greencard (EB1-B（
符合条件者）和n……nn--n[发自未名空间Android客户端]

r*******e
发帖数: 7583

来自主题: JobHunting版 - Uber总部Big Data / 大数据组急招engineers

kafka 相当于 goops，pub/sub messaging
samza/storm/spark基本上是基于MapReduce的realtime processing pipeline

r********n
发帖数: 75

来自主题: JobHunting版 - 微软没落的根源

这个nyse不用windows不是也down了？
windows的主要问题是工具不好用。太不好用。还非的挂个傻逼gui。查个log还要远程
登录，当然不知道现在有没有kafka了。更不要提powershell这个傻逼。用python都快
的多。
性能和安全其实短板不是很大。iocp很早就很快很强大。

y*********0
发帖数: 406

来自主题: JobHunting版 - Uber总部Big Data大数据组急招一名full stack engineer

直接上 https://github.com/yahoo/kafka-manager

p******2
发帖数: 86

来自主题: JobHunting版 - 利用kafka 幫助不同进程见传输数据靠谱么

不靠谱
不如用tcp

N*****m
发帖数: 42603

来自主题: JobHunting版 - 利用kafka 幫助不同进程见传输数据靠谱么

一般的单机应用，0mq就可以了

w**********0
发帖数: 192

来自主题: JobHunting版 - 驳G家的技术不如FLA先进

随便举几个例子
初代GFS出生在2001年外界的山寨版hadoop2007年才出现
等到外面开始做HDFS , Google已经开始基于Colossus做spanner了
领先外面的技术至少5-6年
再说个硬件的智能汽车
DARPA够牛吧从上世纪90年代开始每年国防部大笔的钱投下去试图开发出可以自
主行驶的车辆应用到无人坦克上减少美军的伤亡一直没有大的突破结果这个自
动驾驶技术被G做出来了可以上路跑了
有些朋友列举了一些F A的技术，这事情就是见仁见智了， F A这些年也还是做了一
些东西
可是L? L做了什么？ kafka? 这玩意无论技术的难度，创新性, 业界影响力，
与GFS/Bigtable Cassandra, AWS这些，有可比性么？
纯粹论技术这四家里面有L垫底怎么也轮不到说 “G家的技术比起FLA” 怎样怎
样

j*****n
发帖数: 1545

来自主题: JobHunting版 - 驳G家的技术不如FLA先进

我觉得 kafka 和 cassandra 还是可以比一比的

j*****n
发帖数: 1545

来自主题: JobHunting版 - 驳G家的技术不如FLA先进

我觉得 kafka 和 cassandra 还是可以比一比的

w**********0
发帖数: 192

来自主题: JobHunting版 - 驳G家的技术不如FLA先进

Cassandra 2006-2007就做好 2008年就开源了
kafka 2011年才搞出来这时候Facebook都决定不用cassandra了
再者一个分布式消息队列怎么也没法和cassandra比人家至少一个NoSql的产品是
要和mangoDB这些比的。刚出品的时候 twitter digg这些公司都高调选择采用

I*******g
发帖数: 7600

来自主题: JobHunting版 - 现在start up 铺天盖地

说到底，就是因为太多的open source拿来就用，没有成本，
都是一窝蜂，最后98.9%都死在沙滩上。
比如，mongoDB, casandra, Zookeeper, Hadoop, Hive, Apache Kafka, Storm,
Couchbase and Vertica

d******e
发帖数: 2265

来自主题: JobHunting版 - 为何说银行的IT没前途？银行系统应该安全和业务做的很严谨吧？

另一方面，银行技术严重老化。跟最新技术十分费劲。
见过还用kafka做实时数据处理分析的。
这尼玛都是什么水平。

w****a
发帖数: 710

来自主题: JobHunting版 - U/A/Z去哪家？(面经随后更新）

这两天收到打车app，租房app，某all in one hr平台的口头offer，package细节下周
能出来，这周末提前好好考虑下。
另外手里还有个fb的offer保底。
板上大牛们帮分析下，现在去哪家还能有点汤喝？
---
10/28 update
准备卖身去打车公司当司机了，要去的组我非常喜欢，感觉能学到很多东西。
其实租房网也很不错，我其实纠结了很久。他们家去了之后基本可以随便去喜欢的组，
做喜欢的事情，这点很给力。至于车间的装修多么的好，我就不用说了，大家随便搜搜
图片就可以看出来。
但是综合来看，最后还是选择去当司机。主要是以下几点原因：
1. 要去的组业务多，公司貌似很重视。我觉得很能锻炼人，这个对new grads来说比什
么都重要。
2. 要去的组同胞多，甚至基本都是同胞。我觉得在美国，真正最后能帮上忙称之为人
脉的，永远只能是同胞。
3. 未来的manager是标准的德艺双馨，我打听了很多人，都说口碑很好。我觉得找工作
跟找phd有些许相似的地方，公司本身未必那么的重要，去哪个组以及你的老板怎么样
，有时候能直接决定你的career path。
4. Packa... 阅读全帖

i*****7
发帖数: 92

来自主题: JobHunting版 - ShareThis这个公司怎么样

刚面试感觉还不错，做社会化广告，80多人，engineer大概20来个，阿三不算多。用
kafka, cassandra，google bigquery这些技术。
有了解这公司的不？是不是个坑？

p****6
发帖数: 724

来自主题: JobHunting版 - 讨论两道L家的设计题

第二题考你会不会用kafka和某流处理的工具，老题了

y******s
发帖数: 92

来自主题: JobHunting版 - 讨论两道L家的设计题

能再具体说说吗？多谢
没有用过kafka。。。

m******3
发帖数: 346

来自主题: JobHunting版 - 讨论两道L家的设计题

scale up不是一个好的设计啊，应该是scale out, central server应该是一个cluster
,否则你会有single point failure问题啊
不过我还是觉得楼上说的要去看kafka是正解

m******3
发帖数: 346

来自主题: JobHunting版 - 讨论两道L家的设计题

scale up不是一个好的设计啊，应该是scale out, central server应该是一个cluster
,否则你会有single point failure问题啊
不过我还是觉得楼上说的要去看kafka是正解

g*****g
发帖数: 34805

来自主题: JobHunting版 - 讨论两道L家的设计题

2. pull is too long. push to a Kafka Q and use a dedicated cluster to
process. You can leverage Storm Spark etc.

b**********5
发帖数: 7881

来自主题: JobHunting版 - 讨论两道L家的设计题

yes, lots of big data processing follows this template. some signal. in
this case, errors, generated and got put on kafka. storm/spark processes,
and whatever got processed then got put into Nosql database

o******0
发帖数: 105

来自主题: JobHunting版 - 讨论两道L家的设计题

如果工作中没用到过kafka,redis, storm/spark之类的热门东西，面试design题时，说
要用它们解决，能行吗？问深了，会不会露馅？

t*****t
发帖数: 86

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

搭个顺风车同求。

w*****x
发帖数: 11

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

同求

c**********t
发帖数: 23

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

同求

d********i
发帖数: 582

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

cassandra: https://teddyma.gitbooks.io/learncassandra/content/index.html

i*****h
发帖数: 1534

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

谢谢皮卡丘！

d******v
发帖数: 801

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

谢谢！

l*******e
发帖数: 127

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

Tutorial from datastax:
https://academy.datastax.com/courses

b**********5
发帖数: 7881

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

这个傻逼datastax，我觉得cassandra流行，就是这傻逼公司搞的。我看见这个
createtable primarykey，就想吐。。。

h*******0
发帖数: 270

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

牛肉姐，为什么你看到creatable primary key就像吐？为什么你这么不喜欢
cassandra？你觉得什么db比较好？

j**********3
发帖数: 3211

来自主题: JobHunting版 - 求推荐：学习cassandra和 kafka的资料

同求，可是我想问一下，自学有啥意思？这种东西不用的话相当于没用啊

h*******e
发帖数: 1377

来自主题: JobHunting版 - 奋斗在湾区，码农的生活（转载自天涯 by eatapple211

看了天涯eatapple211大哥写得留学和湾区工作生活感觉写得很好，转过来给大家分享
一下。
如果eatapple211大哥看到了莫怪莫怪。
----------------------------------------------------------------------------
---
看了版上很多贴，好像没有人是介绍在美国做IT的生活，于是忽然很想写写自己在湾区
当程序员的生活，算是给大家介绍另一个方面的美国。
楼主是2007年来的美国读计算机的博士，2011年底拿到一个小公司的offer，以硕
士身份开始工作，同时保留学籍，做parttime学生，2013年1月第一次跳槽，同年5月博
士毕业， 2014年10月再次跳槽，然后在当前公司干到现在。三年多的时间，我能感受
到这个全球最有想法，生活节奏最快的地方欣欣向荣的活力。在这里有梦想，有努力，
有汗水，有眼泪。这里不是天堂，因为这里的房价简直让人崩溃。这里又是最好的淘
金地，因为它有那么多一夜暴富的例子，我希望能够用我贫瘠的文笔向大家展示这里的
生活百态，或者，IT圈子里的生活百态。
首先，湾区的程序员基本是自称... 阅读全帖

j*****8
发帖数: 3635

来自主题: JobHunting版 - C*, Kafka这种怎么自学？

现在的驴用的都是其它的商业产品。因为你说想玩玩就给你分几个server似乎不太可能
，更不用说让你在production里加hook了。
该怎么破？光看文档看100遍也没用阿

y******s
发帖数: 92

来自主题: JobHunting版 - C*, Kafka这种怎么自学？

弱问C*是什么

p*****2
发帖数: 21240

来自主题: JobHunting版 - C*, Kafka这种怎么自学？

来我们这里可以玩

g*****g
发帖数: 34805

来自主题: JobHunting版 - C*, Kafka这种怎么自学？

做开发你就本地跑一下单机版本就是了，除非你是做运维的要学习各种config。

p*******n
发帖数: 2697

来自主题: JobHunting版 - C*, Kafka这种怎么自学？

cassandra【在 yimingts (小人物) 的大作中提到: 】

S********t
发帖数: 3431

来自主题: JobHunting版 - 【讨论】作为一个即将决定去FLGT的小博，谈谈我的看法

说到大公司，而且除非是infra组的，通常也就是作为client去用各种infra搭积木，最
多就是了解各个积木的功能/特点/性能，并不是能把每一块都吃透。当然，大公司里面
tech talk，design doc, deep dive这些学习机会也非常多，看个人用功与否了。其实
大部分不是对技术特别的钻研的人，看看tutorial/overview/user guide/client api
也就差不多了，要把每个用到的积木都钻透，还真没那么多时间和精力。几年干下来，
总觉得什么都懂，但是又什么都不懂。
另外就是大公司自己内部用的很多东西给外面(open source)的不一样，从storage
layer, 到source control, build system, framework/platforms, 虽然在open
source大多都能找到similar or alternative solution，e.g., bigtable/kansas->
hbase/cassandra, goops->kafka, guice->spring, chubby->zookeepe... 阅读全帖

s*****r
发帖数: 43070

来自主题: JobHunting版 - 【讨论】作为一个即将决定去FLGT的小博，谈谈我的看法

这些开源的玩意都是山寨师傅的，把师傅的东西都学会的，山寨的东西能有多难
你把狗的这些精华搞懂了，放出去至少也是tech lead的水平。外面公司能把C*，
hadoop，AWS，spring，zookeeper和kafka都练过一遍的码农非常稀少，狗家牛X在让你
天天去练这些。

api

j*****y
发帖数: 2042

来自主题: JobHunting版 - 某打车公司用java面可以吗？

不至于，也用kafka吧

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天