f*******r 发帖数: 976 | 1 恭喜,都是好包袱!
关键字: 面经
发信站: BBS 未名空间站 (Sat Jun 13 17:27:31 2015, 美东)
前段时间骑驴找马终于告一段落,感觉本版的技术贴和面经贴帮助非常之大,也非常感
谢共享资源的各路大牛。希望提供一些信息和个人感受给还在找工的童鞋,有帮助最好
,但是毕竟本人资历尚浅,如果有不对的地方也请轻喷。
背景:
ms毕业不到两年
主要申请公司:
offer:facebook,google,uber,palantir,sumo logic,walmartlab,yahoo,
amazon,apple
reject:dropbox
主要几个包裹:
U: 145k base + 25k股 RSU
F: 150k base + 40k signon + 10%bonus + 260k美元 RSU
W: 165k base + 50k signon + 20%bonus + 35k美元 RSU每年(
这个略复杂,相当于每年35k美元RSU的refres... 阅读全帖 |
|
b*****n 发帖数: 618 | 2 比如z-like order
不用很复杂。。。这个应该是他们还没做的东西,
面试的时候不用指望这种细节都很完美吧,没搞过geo的恐怕都需要回去查查资料大概
需要怎么做。
前面需要service tier把不同的event stream到Kafka,然后storm只是based on time
和geo hash做aggregation,可以提供不同的granularity,然后把结果存到任何一个
database或者kv store就行了。 |
|
g*****g 发帖数: 34805 | 3 Kafka does exactly that. But you can't avoid data loss during partition, in
other words, availability is sacrificed. There's no silver bullet. |
|
t*********r 发帖数: 387 | 4 Kafka's ISR together with its f failure tolerance in f+1 nodes is a bad
guarantee, which is why data can be lost.
availability |
|
p****6 发帖数: 724 | 5
cassandra, HDFS, Zookeeper, Kafka, Storm 读懂documentation 通吃。排名分先后
:) |
|
s********l 发帖数: 998 | 6 这么多设计题啊。。。
面的什么level啊?
第一个设计 类似育kafka?
第三轮 类似于 time vector?
请教 第五轮 你怎么设计的
interviewer怎么guide的?
谢谢 |
|
S*******r 发帖数: 14 | 7 我在Uber Data Infrastructure组做hiring manager,现在开始为下半年招人,
backend engineer, full stack engineer, DevOps都要,名额充足。只要有Hadoop/
Kafka/Samza/Storm/Spark/Memsql/Riak/Hbase/Vertica相关经验,或者类似的系统(
例如狗家的码工)的同学都欢迎投。
工作地点在总部San Francisco, Uber支持H1B和Greencard (EB1-B(符合条件者)和
EB2都可)
版上的同学如果有兴趣,请投简历到 [email protected]
/* */,这个email我亲自查
看,保证每个简历我都会看一遍。合适者立即电面。 |
|
G*****m 发帖数: 5395 | 8 大牛能说说这些狗家对应的都是啥吗?
Hadoop/Kafka/Samza/Storm/Spark/Memsql/Riak/Hbase/Vertica
hadoop是mapreduce?
其他的呢? |
|
e********3 发帖数: 229 | 9 就会hadoop. hbase/kafka/storm学过但是工作不用...也写不到简历上...可以投贵组
backend职位么? |
|
b**********5 发帖数: 7881 | 10 我就知道hadoop, kafka, storm, hbase, spark知道是干嘛。。。没用过 |
|
p****w 发帖数: 90 | 11 zan nn【在 Starpower (喵)的大作中提到:】n:n:我在Uber Data Infrastructure
组做hiring manager,现在开始为下半年招人,n:backend engineer, full stack
engineer, DevOps都要,名额充足。只要有Hadoop/n:Kafka/Samza/Storm/Spark/
Memsql/Riak/Hbase/Vertica相关经验,或者类似的系统(n:例如狗家的码工)的同学
都欢迎投。n:n:工作地点在总部San Francisco, Uber支持H1B和Greencard (EB1-B(
符合条件者)和n……nn--n[发自未名空间Android客户端] |
|
r*******e 发帖数: 7583 | 12 kafka 相当于 goops,pub/sub messaging
samza/storm/spark基本上是基于MapReduce的realtime processing pipeline |
|
r********n 发帖数: 75 | 13 这个nyse不用windows不是也down了?
windows的主要问题是工具不好用。太不好用。还非的挂个傻逼gui。查个log还要远程
登录,当然不知道现在有没有kafka了。更不要提powershell这个傻逼。用python都快
的多。
性能和安全其实短板不是很大。iocp很早就很快很强大。 |
|
|
|
|
w**********0 发帖数: 192 | 17 随便举几个例子
初代GFS出生在2001年 外界的山寨版hadoop2007年才出现
等到外面开始做HDFS , Google已经开始基于Colossus做spanner了
领先外面的技术至少5-6年
再说个硬件的 智能汽车
DARPA够牛吧 从上世纪90年代开始 每年国防部大笔的钱投下去 试图开发出可以自
主行驶的车辆 应用到无人坦克上 减少美军的伤亡 一直没有大的突破 结果这个自
动驾驶技术被G做出来了 可以上路跑了
有些朋友列举了一些F A的技术, 这事情就是见仁见智了, F A这些年也还是做了一
些东西
可是L? L做了什么? kafka? 这玩意无论技术的难度, 创新性, 业界影响力,
与GFS/Bigtable Cassandra, AWS这些,有可比性么?
纯粹论技术 这四家里面有L垫底 怎么也轮不到说 “G家的技术比起FLA” 怎样怎
样 |
|
j*****n 发帖数: 1545 | 18 我觉得 kafka 和 cassandra 还是可以比一比的 |
|
j*****n 发帖数: 1545 | 19 我觉得 kafka 和 cassandra 还是可以比一比的 |
|
w**********0 发帖数: 192 | 20 Cassandra 2006-2007就做好 2008年就开源了
kafka 2011年才搞出来 这时候Facebook都决定不用cassandra了
再者 一个分布式消息队列怎么也没法和cassandra比 人家至少一个NoSql的产品 是
要和mangoDB这些比的。 刚出品的时候 twitter digg这些公司都高调选择采用 |
|
I*******g 发帖数: 7600 | 21 说到底, 就是因为太多的open source拿来就用, 没有成本,
都是一窝蜂, 最后98.9%都死在沙滩上。
比如,mongoDB, casandra, Zookeeper, Hadoop, Hive, Apache Kafka, Storm,
Couchbase and Vertica |
|
d******e 发帖数: 2265 | 22 另一方面,银行技术严重老化。跟最新技术十分费劲。
见过还用kafka做实时数据处理分析的。
这尼玛都是什么水平。 |
|
w****a 发帖数: 710 | 23 这两天收到打车app,租房app,某all in one hr平台的口头offer,package细节下周
能出来,这周末提前好好考虑下。
另外手里还有个fb的offer保底。
板上大牛们帮分析下,现在去哪家还能有点汤喝?
---
10/28 update
准备卖身去打车公司当司机了,要去的组我非常喜欢,感觉能学到很多东西。
其实租房网也很不错,我其实纠结了很久。他们家去了之后基本可以随便去喜欢的组,
做喜欢的事情,这点很给力。至于车间的装修多么的好,我就不用说了,大家随便搜搜
图片就可以看出来。
但是综合来看,最后还是选择去当司机。主要是以下几点原因:
1. 要去的组业务多,公司貌似很重视。我觉得很能锻炼人,这个对new grads来说比什
么都重要。
2. 要去的组同胞多,甚至基本都是同胞。我觉得在美国,真正最后能帮上忙称之为人
脉的,永远只能是同胞。
3. 未来的manager是标准的德艺双馨,我打听了很多人,都说口碑很好。我觉得找工作
跟找phd有些许相似的地方,公司本身未必那么的重要,去哪个组以及你的老板怎么样
,有时候能直接决定你的career path。
4. Packa... 阅读全帖 |
|
i*****7 发帖数: 92 | 24 刚面试感觉还不错,做社会化广告,80多人,engineer大概20来个,阿三不算多。用
kafka, cassandra,google bigquery这些技术。
有了解这公司的不?是不是个坑? |
|
p****6 发帖数: 724 | 25 第二题考你会不会用kafka和某流处理的工具,老题了 |
|
y******s 发帖数: 92 | 26 能再具体说说吗?多谢
没有用过kafka。。。 |
|
m******3 发帖数: 346 | 27 scale up不是一个好的设计啊,应该是scale out, central server应该是一个cluster
,否则你会有single point failure问题啊
不过我还是觉得楼上说的要去看kafka是正解 |
|
m******3 发帖数: 346 | 28 scale up不是一个好的设计啊,应该是scale out, central server应该是一个cluster
,否则你会有single point failure问题啊
不过我还是觉得楼上说的要去看kafka是正解 |
|
g*****g 发帖数: 34805 | 29 2. pull is too long. push to a Kafka Q and use a dedicated cluster to
process. You can leverage Storm Spark etc. |
|
b**********5 发帖数: 7881 | 30 yes, lots of big data processing follows this template. some signal. in
this case, errors, generated and got put on kafka. storm/spark processes,
and whatever got processed then got put into Nosql database |
|
o******0 发帖数: 105 | 31 如果工作中没用到过kafka,redis, storm/spark之类的热门东西,面试design题时,说
要用它们解决,能行吗?问深了,会不会露馅? |
|
|
|
|
|
|
|
|
b**********5 发帖数: 7881 | 39 这个傻逼datastax, 我觉得cassandra流行, 就是这傻逼公司搞的。 我看见这个
createtable primarykey, 就想吐。。。 |
|
h*******0 发帖数: 270 | 40 牛肉姐, 为什么你看到creatable primary key就像吐? 为什么你这么不喜欢
cassandra? 你觉得什么db比较好? |
|
j**********3 发帖数: 3211 | 41 同求,可是 我想问一下,自学有啥意思?这种东西不用的话相当于没用啊 |
|
h*******e 发帖数: 1377 | 42 看了天涯eatapple211大哥写得留学和湾区工作生活感觉写得很好,转过来给大家分享
一下。
如果eatapple211大哥看到了莫怪莫怪。
----------------------------------------------------------------------------
---
看了版上很多贴,好像没有人是介绍在美国做IT的生活,于是忽然很想写写自己在湾区
当程序员的生活,算是给大家介绍另一个方面的美国。
楼主是2007年来的美国读计算机的博士,2011年底拿到一个小公司的offer,以硕
士身份开始工作,同时保留学籍,做parttime学生,2013年1月第一次跳槽,同年5月博
士毕业, 2014年10月再次跳槽,然后在当前公司干到现在。三年多的时间,我能感受
到这个全球最有想法,生活节奏最快的地方欣欣向荣的活力。在这里有梦想,有努力,
有汗水, 有眼泪。这里不是天堂,因为这里的房价简直让人崩溃。这里又是最好的淘
金地,因为它有那么多一夜暴富的例子,我希望能够用我贫瘠的文笔向大家展示这里的
生活百态,或者,IT圈子里的生活百态。
首先,湾区的程序员基本是自称... 阅读全帖 |
|
j*****8 发帖数: 3635 | 43 现在的驴用的都是其它的商业产品。因为你说想玩玩就给你分几个server似乎不太可能
,更不用说让你在production里加hook了。
该怎么破?光看文档看100遍也没用阿 |
|
|
|
g*****g 发帖数: 34805 | 46 做开发你就本地跑一下单机版本就是了,除非你是做运维的要学习各种config。 |
|
p*******n 发帖数: 2697 | 47 cassandra【 在 yimingts (小人物) 的大作中提到: 】 |
|
S********t 发帖数: 3431 | 48 说到大公司,而且除非是infra组的,通常也就是作为client去用各种infra搭积木,最
多就是了解各个积木的功能/特点/性能,并不是能把每一块都吃透。当然,大公司里面
tech talk,design doc, deep dive这些学习机会也非常多,看个人用功与否了。其实
大部分不是对技术特别的钻研的人,看看tutorial/overview/user guide/client api
也就差不多了,要把每个用到的积木都钻透,还真没那么多时间和精力。几年干下来,
总觉得什么都懂,但是又什么都不懂。
另外就是大公司自己内部用的很多东西给外面(open source)的不一样,从storage
layer, 到source control, build system, framework/platforms, 虽然在open
source大多都能找到similar or alternative solution,e.g., bigtable/kansas->
hbase/cassandra, goops->kafka, guice->spring, chubby->zookeepe... 阅读全帖 |
|
s*****r 发帖数: 43070 | 49 这些开源的玩意都是山寨师傅的,把师傅的东西都学会的,山寨的东西能有多难
你把狗的这些精华搞懂了,放出去至少也是tech lead的水平。外面公司能把C*,
hadoop,AWS,spring,zookeeper和kafka都练过一遍的码农非常稀少,狗家牛X在让你
天天去练这些。
api |
|
|