j******a 发帖数: 55 | 1 本人CS PhD quit,所以算是fresh master吧。。。。。。职位就是entry-level的码农。
湾区大家都知道的某大公司,但是在板上讨论的非常少,这两年公司沉寂了。。。
120K+15K sign on+ some RSU
做的东西是码农为主,兼做一点点machine learning方面的研究。公司这两年投了2.5B
在我要去的这个大组,去年已经有1B的revenue了。感觉人少机会多,当然也会更累些
。但是公司假期比较多(两周的带薪shutdown,个人带薪假没有上限找经理批),而且
work life balance据说还比较好。
Yahoo!match了almost same package+20K sign on+free food
不过职位是纯Coding。Model都是Yahoo! Lab出的,认识的大部分在Yahoo的人都在Lab
里,让自己也很汗颜,sigh。。。Yahoo!投简历后直接给的Y day onsite,onsite安
排的很狗血,考的问题也就是微软难度。只有最后一个面试官是machine learning 相
关的,聊得很欢,他直接把CEO的公司会pass 掉了,面了1个多小时,技术题后来看到
有人在FB面经中提到过的,如何做基于地理信息的推荐,在这个系统中如何自动设置阈
值等等,临场想了很多想法,有一个是他想要的。他人很谦虚,我和他说我用sql都是
查手册的,他来了句我都工作十多年了还是要查手册,瞬间暖场。其实蛮喜欢Yahoo!
现在的,里面的snack和food都很不错,CEO让这个公司有一种向上的感觉。我觉得
Yahoo的股票要么成为垃圾,要么肯定会比现在的价格高,所以它的RSU更有收益价值,
虽然期望差不多:-)
我其实倾向于前者,虽然Yahoo!的钱并不少。不过好像401K好像是Yahoo!的好些,我
没有看到具体的条款,offer上说的是,前者是match contribution的6%的一半,Yahoo
好像是match你的contribution的25%,但是貌似没说有上限。
背景:除了GRE很低,其他方面IT公司看重的东西简历上都有些。Top Tier的公司基本
上都给Onsite了,包括一些金融公司,大部分onsite都还没去。我想图个稳定,很可能
就从了第一家,先不考虑其它的了。有些culture比较mean的大公司直接没申。
其他公司的面经,其实牛逼公司的也是大家经常见的题目。补充几道没见过的:
之前面Yammer,有个国人大哥出了一道设计题,之前没见过,现想的答案他认可了。就
是n台机器做web crawler,如何保证每个网页只被download一次,就是n台机器里面只
能有一个机器访问某网页一次。要求系统效率高,communication负荷小。
P家:clone graph,用了一个很实际的问题去描述,说得很复杂,不过最后就是实现
clone graph的变种。 |
t********e 发帖数: 344 | |
l*****a 发帖数: 14598 | 3 401K 个人contribution是有上限的
农。
5B
Lab
【在 j******a 的大作中提到】 : 本人CS PhD quit,所以算是fresh master吧。。。。。。职位就是entry-level的码农。 : 湾区大家都知道的某大公司,但是在板上讨论的非常少,这两年公司沉寂了。。。 : 120K+15K sign on+ some RSU : 做的东西是码农为主,兼做一点点machine learning方面的研究。公司这两年投了2.5B : 在我要去的这个大组,去年已经有1B的revenue了。感觉人少机会多,当然也会更累些 : 。但是公司假期比较多(两周的带薪shutdown,个人带薪假没有上限找经理批),而且 : work life balance据说还比较好。 : Yahoo!match了almost same package+20K sign on+free food : 不过职位是纯Coding。Model都是Yahoo! Lab出的,认识的大部分在Yahoo的人都在Lab : 里,让自己也很汗颜,sigh。。。Yahoo!投简历后直接给的Y day onsite,onsite安
|
j*****y 发帖数: 1071 | 4 恭喜.
那个 n 台 机器 web crawler怎么搞阿,每台机器负责某个范围内的
domain name ? 比如 机器 1 download 域名是 a-e, 的机器二负责 f-k的, ...
?
本人CS PhD quit,所以算是fresh master吧。。。。。。职位就是entry-level的码农。
湾区大家都知道的某大公司,但是在板上讨论的非常少,这两年公司沉寂了。。。
120K+15K sign on+ some RSU
做的东西是码农为主,兼做一点点machine learning方面的研究。公司这两年投了2.5B
在我要去的这个大组,去年已经有1B的revenue了。感觉人少机会多,当然也会更累些
。但是公司假期比较多(两周的带薪shutdown,个人带薪假没有上限找经理批),而且
work life balance据说还比较好。
Yahoo!match了almost same package+20K sign on+free food
不过职位是纯Coding。Model都是Yahoo! Lab出的,认识的大部分在Yahoo的人都在Lab
里,让自己也很汗颜,sigh。。。Yahoo!投简历后直接给的Y day onsite,onsite安
排的很狗血,考的问题也就是微软难度。只有最后一个面试官是machine learning 相
关的,聊得很欢,他直接把CEO的公司会pass 掉了,面了1个多小时,技术题后来看到
有人在FB面经中提到过的,如何做基于地理信息的推荐,在这个系统中如何自动设置阈
值等等,临场想了很多想法,有一个是他想要的。他人很谦虚,我和他说我用sql都是
查手册的,他来了句我都工作十多年了还是要查手册,瞬间暖场。其实蛮喜欢Yahoo!
现在的,里面的snack和food都很不错,CEO让这个公司有一种向上的感觉。我觉得
Yahoo的股票要么成为垃圾,要么肯定会比现在的价格高,所以它的RSU更有收益价值,
虽然期望差不多:-)
我其实倾向于前者,虽然Yahoo!的钱并不少。不过好像401K好像是Yahoo!的好些,我
没有看到具体的条款,offer上说的是,前者是match contribution的6%的一半,Yahoo
好像是match你的contribution的25%,但是貌似没说有上限。
背景:除了GRE很低,其他方面IT公司看重的东西简历上都有些。Top Tier的公司基本
上都给Onsite了,包括一些金融公司,大部分onsite都还没去。我想图个稳定,很可能
就从了第一家,先不考虑其它的了。有些culture比较mean的大公司直接没申。
其他公司的面经,其实牛逼公司的也是大家经常见的题目。补充几道没见过的:
之前面Yammer,有个国人大哥出了一道设计题,之前没见过,现想的答案他认可了。就
是n台机器做web crawler,如何保证每个网页只被download一次,就是n台机器里面只
能有一个机器访问某网页一次。要求系统效率高,communication负荷小。
P家:clone graph,用了一个很实际的问题去描述,说得很复杂,不过最后就是实现
clone graph的变种。
【在 j******a 的大作中提到】 : 本人CS PhD quit,所以算是fresh master吧。。。。。。职位就是entry-level的码农。 : 湾区大家都知道的某大公司,但是在板上讨论的非常少,这两年公司沉寂了。。。 : 120K+15K sign on+ some RSU : 做的东西是码农为主,兼做一点点machine learning方面的研究。公司这两年投了2.5B : 在我要去的这个大组,去年已经有1B的revenue了。感觉人少机会多,当然也会更累些 : 。但是公司假期比较多(两周的带薪shutdown,个人带薪假没有上限找经理批),而且 : work life balance据说还比较好。 : Yahoo!match了almost same package+20K sign on+free food : 不过职位是纯Coding。Model都是Yahoo! Lab出的,认识的大部分在Yahoo的人都在Lab : 里,让自己也很汗颜,sigh。。。Yahoo!投简历后直接给的Y day onsite,onsite安
|
g*********e 发帖数: 14401 | |
P**********c 发帖数: 3417 | 6 第一个是AOL?
农。
5B
Lab
【在 j******a 的大作中提到】 : 本人CS PhD quit,所以算是fresh master吧。。。。。。职位就是entry-level的码农。 : 湾区大家都知道的某大公司,但是在板上讨论的非常少,这两年公司沉寂了。。。 : 120K+15K sign on+ some RSU : 做的东西是码农为主,兼做一点点machine learning方面的研究。公司这两年投了2.5B : 在我要去的这个大组,去年已经有1B的revenue了。感觉人少机会多,当然也会更累些 : 。但是公司假期比较多(两周的带薪shutdown,个人带薪假没有上限找经理批),而且 : work life balance据说还比较好。 : Yahoo!match了almost same package+20K sign on+free food : 不过职位是纯Coding。Model都是Yahoo! Lab出的,认识的大部分在Yahoo的人都在Lab : 里,让自己也很汗颜,sigh。。。Yahoo!投简历后直接给的Y day onsite,onsite安
|
P*******b 发帖数: 1001 | 7 lz牛人啊
农。
5B
Lab
【在 j******a 的大作中提到】 : 本人CS PhD quit,所以算是fresh master吧。。。。。。职位就是entry-level的码农。 : 湾区大家都知道的某大公司,但是在板上讨论的非常少,这两年公司沉寂了。。。 : 120K+15K sign on+ some RSU : 做的东西是码农为主,兼做一点点machine learning方面的研究。公司这两年投了2.5B : 在我要去的这个大组,去年已经有1B的revenue了。感觉人少机会多,当然也会更累些 : 。但是公司假期比较多(两周的带薪shutdown,个人带薪假没有上限找经理批),而且 : work life balance据说还比较好。 : Yahoo!match了almost same package+20K sign on+free food : 不过职位是纯Coding。Model都是Yahoo! Lab出的,认识的大部分在Yahoo的人都在Lab : 里,让自己也很汗颜,sigh。。。Yahoo!投简历后直接给的Y day onsite,onsite安
|
p*****2 发帖数: 21240 | 8
【在 g*********e 的大作中提到】 : 现在fresh ms base都是120k了?
|
P**********c 发帖数: 3417 | 9 AOL fresh master好像就是120k. 不知道楼主是不是他家。
【在 g*********e 的大作中提到】 : 现在fresh ms base都是120k了?
|
c****m 发帖数: 179 | 10 不是AOL的,没试过AOL。
【在 P**********c 的大作中提到】 : AOL fresh master好像就是120k. 不知道楼主是不是他家。
|
|
|
c****m 发帖数: 179 | 11 嗯,我答的是,把URL统一的hash,然后每个机器负责一部分。
机器之间可以有范围的overlap,这样更robust。还要maintain一个local的hashset去
重并且防止死循环。他还问了些基于这个的拓展。
农。
5B
【在 j*****y 的大作中提到】 : 恭喜. : 那个 n 台 机器 web crawler怎么搞阿,每台机器负责某个范围内的 : domain name ? 比如 机器 1 download 域名是 a-e, 的机器二负责 f-k的, ... : ? : : 本人CS PhD quit,所以算是fresh master吧。。。。。。职位就是entry-level的码农。 : 湾区大家都知道的某大公司,但是在板上讨论的非常少,这两年公司沉寂了。。。 : 120K+15K sign on+ some RSU : 做的东西是码农为主,兼做一点点machine learning方面的研究。公司这两年投了2.5B : 在我要去的这个大组,去年已经有1B的revenue了。感觉人少机会多,当然也会更累些
|
c****m 发帖数: 179 | 12 大牛见笑了,我这个是argue过以后的offer,比同公司同样的fresh的package要高的。
【在 p*****2 的大作中提到】
|
c****m 发帖数: 179 | 13 没去Yahoo。
想看一下大家的建议。我倾向于前者。
【在 t********e 的大作中提到】 : 弱问一下,是去了yahoo吗?
|
d********g 发帖数: 10550 | 14 crawler这个,能在部署上用queue来调度worker吗?
【在 c****m 的大作中提到】 : 嗯,我答的是,把URL统一的hash,然后每个机器负责一部分。 : 机器之间可以有范围的overlap,这样更robust。还要maintain一个local的hashset去 : 重并且防止死循环。他还问了些基于这个的拓展。 : : 农。 : 5B
|
j*****y 发帖数: 1071 | 15 你这个 URL 统一的 hash是怎么做的阿,因为事先都不知道有哪些 URL, 怎么统一的
hash阿?
【在 c****m 的大作中提到】 : 嗯,我答的是,把URL统一的hash,然后每个机器负责一部分。 : 机器之间可以有范围的overlap,这样更robust。还要maintain一个local的hashset去 : 重并且防止死循环。他还问了些基于这个的拓展。 : : 农。 : 5B
|
c****m 发帖数: 179 | 16 就是用同一个Hash函数,不必perfect,可以有collision。
URL的组成和范围是知道的,不同长度补零就是了,Hash function有很多选择的。
【在 j*****y 的大作中提到】 : 你这个 URL 统一的 hash是怎么做的阿,因为事先都不知道有哪些 URL, 怎么统一的 : hash阿?
|
c****m 发帖数: 179 | 17 每个机器上应该是有个queue的来遍历graph。但是要maintai一个去重的hashset。
【在 d********g 的大作中提到】 : crawler这个,能在部署上用queue来调度worker吗?
|
j*****y 发帖数: 1071 | 18 那你是是通过 划分 hash value的范围来 选择那些 key对应的 URL 由哪台机器下
载是吧,
比如 hash value的范围是 1-10, 有两台机器,如果 hash value的值是 1-5, 就由
第一台机器下载, 如果 hash value的值是 6-10就由第二台机器下载
【在 c****m 的大作中提到】 : 就是用同一个Hash函数,不必perfect,可以有collision。 : URL的组成和范围是知道的,不同长度补零就是了,Hash function有很多选择的。
|
c****m 发帖数: 179 | 19 基本思路是这样的,但是要有overlap,防止有的机器down掉。1-5,3-8,6-10,类似这
样子。
【在 j*****y 的大作中提到】 : 那你是是通过 划分 hash value的范围来 选择那些 key对应的 URL 由哪台机器下 : 载是吧, : 比如 hash value的范围是 1-10, 有两台机器,如果 hash value的值是 1-5, 就由 : 第一台机器下载, 如果 hash value的值是 6-10就由第二台机器下载
|
j*****y 发帖数: 1071 | 20 多谢 :)
【在 c****m 的大作中提到】 : 基本思路是这样的,但是要有overlap,防止有的机器down掉。1-5,3-8,6-10,类似这 : 样子。
|
|
|
j******y 发帖数: 2578 | 21 那说说到底是哪家嘛?
【在 c****m 的大作中提到】 : 不是AOL的,没试过AOL。
|
S********e 发帖数: 28 | |
h****e 发帖数: 928 | 23 楼主很强。有competing offers很重要啊。 |
j******a 发帖数: 55 | 24 舍得投2.5B做machine learning 相关的东西的公司也没有几家了。
不过这两天和某top u的几个cs prof聊,大家也不知道还有公司这么愿意转型的。
【在 j******y 的大作中提到】 : 那说说到底是哪家嘛?
|
t*********h 发帖数: 941 | 25 2.5B? Who can afford this? MSFT?
【在 j******a 的大作中提到】 : 舍得投2.5B做machine learning 相关的东西的公司也没有几家了。 : 不过这两天和某top u的几个cs prof聊,大家也不知道还有公司这么愿意转型的。
|
l*****a 发帖数: 180 | |
r******n 发帖数: 351 | 27 第一个阿多比吧. 去第一个. 云组有前途
在 jobmajia (job) 的大作中提到: 】
农。
5B
Lab |
j******a 发帖数: 55 | 28 O这种公司怎么可能这么technical的投资,他家宁可涨工资水招人养老,连申都没申。
。。
不过身边有一牛逼小硕,去了T,match以后也是120K的base, 不过much more option.
..
【在 l*****a 的大作中提到】 : Oracle
|