由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - [quantcast面经] software engineer
相关主题
如何判断一个图中是否有环?请教一下超大图的存储问题
Amazon电面纪实发面经, 求祝福
检查graph里面是否有circle,是用BFS,还是DFS?GM面经
讨论一道图论题顶风狂发G面经,顺求bless
这道计算几何题怎么做?F的puzzle - Liar Liar
有谁知道quantcast的coding coding problem是什么吗再问个amazon面试题
面经-facebook, amazon,telenav, quantcastebay search组面经,估计要挂
三道 Amazon Onsite Coding 题 (转载)有向图判断有无环
相关话题的讨论汇总
话题: 橙汁话题: 基站话题: 10话题: 咖啡话题: ip
进入JobHunting版参与讨论
1 (共1页)
d********w
发帖数: 363
1
1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10
到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
如何把相似的用户聚合,聚类算法?
y***t
发帖数: 644
2
多谢,
第4题是考什么? 是不是相等? 都是0.9?
d********w
发帖数: 363
3
是相等,但肯定不是0.9了

【在 y***t 的大作中提到】
: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

z*****n
发帖数: 447
4
第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫
星中转,再返回地面基站么?卫星也可以有计算能力么
t********e
发帖数: 143
5

10/11

【在 y***t 的大作中提到】
: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

d********w
发帖数: 363
6
卫星和基站都是有计算能力的,可以想象成卫星是内存,基站是磁盘,就是希望最少的
io次数做一些海量数据的统计。
比如算平均值,可以每个基站算个sum跟个数,传给卫星,就知道总共的平均值了

【在 z*****n 的大作中提到】
: 第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫
: 星中转,再返回地面基站么?卫星也可以有计算能力么

q****x
发帖数: 7404
7
面霸呀。

,估
,
10

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10
: 到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g**********y
发帖数: 14569
8
dongfei你是职业面试家还是怎么回事? :-)
我怎么看你各种公司,各种稀奇古怪的问题都被问到了。

,估
,
10

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10
: 到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

d******y
发帖数: 244
9
第四题是1/11
d*****y
发帖数: 205
10

,估
,
10
1 coffee in orange vs 0.9 orange in coffee

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10
: 到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

相关主题
有谁知道quantcast的coding coding problem是什么吗请教一下超大图的存储问题
面经-facebook, amazon,telenav, quantcast发面经, 求祝福
三道 Amazon Onsite Coding 题 (转载)GM面经
进入JobHunting版参与讨论
d********w
发帖数: 363
11
其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁
必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x

【在 d******y 的大作中提到】
: 第四题是1/11
d********w
发帖数: 363
12
这话说得。
我很累的,好不好,光三藩机场就跑了四趟
面试是在透支我的体力的

【在 g**********y 的大作中提到】
: dongfei你是职业面试家还是怎么回事? :-)
: 我怎么看你各种公司,各种稀奇古怪的问题都被问到了。
:
: ,估
: ,
: 10

d*****y
发帖数: 205
13
从体积为11的杯子(10+1)里倒1/10的东西回到9那里,
总和不是10了,是 10.1(9+11/10),
所以相等是不对的。

【在 d********w 的大作中提到】
: 其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁
: 必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x

d********w
发帖数: 363
14
呵呵,我表达错了,应该是最后两个杯子还是一样的体积

【在 d*****y 的大作中提到】
: 从体积为11的杯子(10+1)里倒1/10的东西回到9那里,
: 总和不是10了,是 10.1(9+11/10),
: 所以相等是不对的。

H*****1
发帖数: 4815
15
0.090909
1/11

【在 d********w 的大作中提到】
: 是相等,但肯定不是0.9了
y***t
发帖数: 644
16
第4, 如果把两种不同密度的液体混合,最后的体积不一定是简单的加和。
http://en.wikipedia.org/wiki/Entropy_of_mixing
s******n
发帖数: 3946
17
第4题1:1啊,假设密度一样
最后杯1:Orange=100/11 coffee=10/11,杯2:Orange=10/11 coffee=100/11
j********x
发帖数: 2330
18
面霸!
f**********2
发帖数: 2401
19
多谢分享
d********w
发帖数: 363
20
1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
如何把相似的用户聚合,聚类算法?
相关主题
顶风狂发G面经,顺求blessebay search组面经,估计要挂
F的puzzle - Liar Liar有向图判断有无环
再问个amazon面试题请教一个题目
进入JobHunting版参与讨论
y***t
发帖数: 644
21
多谢,
第4题是考什么? 是不是相等? 都是0.9?
d********w
发帖数: 363
22
是相等,但肯定不是0.9了

【在 y***t 的大作中提到】
: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

z*****n
发帖数: 447
23
第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫
星中转,再返回地面基站么?卫星也可以有计算能力么
t********e
发帖数: 143
24

10/11

【在 y***t 的大作中提到】
: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

d********w
发帖数: 363
25
卫星和基站都是有计算能力的,可以想象成卫星是内存,基站是磁盘,就是希望最少的
io次数做一些海量数据的统计。
比如算平均值,可以每个基站算个sum跟个数,传给卫星,就知道总共的平均值了

【在 z*****n 的大作中提到】
: 第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫
: 星中转,再返回地面基站么?卫星也可以有计算能力么

q****x
发帖数: 7404
26
面霸呀。

,估
,
10

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g**********y
发帖数: 14569
27
dongfei你是职业面试家还是怎么回事? :-)
我怎么看你各种公司,各种稀奇古怪的问题都被问到了。

,估
,
10

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

d******y
发帖数: 244
28
第四题是1/11
d*****y
发帖数: 205
29

,估
,
10
1 coffee in orange vs 0.9 orange in coffee

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

d********w
发帖数: 363
30
其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁
必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x

【在 d******y 的大作中提到】
: 第四题是1/11
相关主题
一个EDA的问题Amazon电面纪实
social 和 cloud 的公司怎么排?检查graph里面是否有circle,是用BFS,还是DFS?
如何判断一个图中是否有环?讨论一道图论题
进入JobHunting版参与讨论
d********w
发帖数: 363
31
这话说得。
我很累的,好不好,光三藩机场就跑了四趟
面试是在透支我的体力的

【在 g**********y 的大作中提到】
: dongfei你是职业面试家还是怎么回事? :-)
: 我怎么看你各种公司,各种稀奇古怪的问题都被问到了。
:
: ,估
: ,
: 10

d*****y
发帖数: 205
32
从体积为11的杯子(10+1)里倒1/10的东西回到9那里,
总和不是10了,是 10.1(9+11/10),
所以相等是不对的。

【在 d********w 的大作中提到】
: 其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁
: 必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x

d********w
发帖数: 363
33
呵呵,我表达错了,应该是最后两个杯子还是一样的体积

【在 d*****y 的大作中提到】
: 从体积为11的杯子(10+1)里倒1/10的东西回到9那里,
: 总和不是10了,是 10.1(9+11/10),
: 所以相等是不对的。

H*****1
发帖数: 4815
34
0.090909
1/11

【在 d********w 的大作中提到】
: 是相等,但肯定不是0.9了
y***t
发帖数: 644
35
第4, 如果把两种不同密度的液体混合,最后的体积不一定是简单的加和。
http://en.wikipedia.org/wiki/Entropy_of_mixing
s******n
发帖数: 3946
36
第4题1:1啊,假设密度一样
最后杯1:Orange=100/11 coffee=10/11,杯2:Orange=10/11 coffee=100/11
j********x
发帖数: 2330
37
面霸!
f**********2
发帖数: 2401
38
多谢分享
g*****e
发帖数: 282
39
1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
--典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的
优化,减少read fault
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
--对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit
int,所以一般的机器内存也够了。
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
--卫星理解成mem,基站为harddrive,分块load data。归结到多个sort array找
median,经典写起来麻烦题~
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙
汁,最后它们体积仍然是10,问橙汁中的咖啡跟咖啡中的橙汁数量关系
--大家已经讨论了
5. 判断有向图中是否有环
--看书就可以了
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
--这个是machine learning啊,不断调各个vector的权重。具体计算可以是edit
distance。我想非ML方向的扯不了太深的。。。
大家再讨论讨论?

,估
,
橙汁,最后它们体积仍然是10,问橙汁

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

l*****a
发帖数: 559
40

,估
需要用到parallel quick sorthttp://www.uio.no/studier/emner/matnat/ifi/INF3380/v10/undervisningsmateriale/inf3380-week12.pdf
一百台机子,10T * 100 = 1PB.
第一步,本地排序。用external sort。
第二步,partition/merge between machines。一共需要传log100次。
所有步骤都是disk io bound。

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

相关主题
讨论一道图论题面经-facebook, amazon,telenav, quantcast
这道计算几何题怎么做?三道 Amazon Onsite Coding 题 (转载)
有谁知道quantcast的coding coding problem是什么吗请教一下超大图的存储问题
进入JobHunting版参与讨论
g*****e
发帖数: 282
41
dongfeiwww你好,
想请教一道具体的题目,是否方便。第一题。这样的题目以你的经历,需要写成map
reduce pseudo code,还是典型的merge sort/external sort即可?多谢

,估
,
橙汁,最后它们体积仍然是10,问橙汁

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g*****e
发帖数: 282
42
1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
--典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的
优化,减少read fault
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
--对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit
int,所以一般的机器内存也够了。
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
--卫星理解成mem,基站为harddrive,分块load data。归结到多个sort array找
median,经典写起来麻烦题~
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙
汁,最后它们体积仍然是10,问橙汁中的咖啡跟咖啡中的橙汁数量关系
--大家已经讨论了
5. 判断有向图中是否有环
--看书就可以了
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
--这个是machine learning啊,不断调各个vector的权重。具体计算可以是edit
distance。我想非ML方向的扯不了太深的。。。
大家再讨论讨论?

,估
,
橙汁,最后它们体积仍然是10,问橙汁

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

l*****a
发帖数: 559
43

,估
需要用到parallel quick sorthttp://www.uio.no/studier/emner/matnat/ifi/INF3380/v10/undervisningsmateriale/inf3380-week12.pdf
一百台机子,10T * 100 = 1PB.
第一步,本地排序。用external sort。
第二步,partition/merge between machines。一共需要传log100次。
所有步骤都是disk io bound。

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g*****e
发帖数: 282
44
dongfeiwww你好,
想请教一道具体的题目,是否方便。第一题。这样的题目以你的经历,需要写成map
reduce pseudo code,还是典型的merge sort/external sort即可?多谢

,估
,
橙汁,最后它们体积仍然是10,问橙汁

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

c****m
发帖数: 179
45
你这第六题的回答还真挺非ML方向的。。。

,估
,
32bit

【在 g*****e 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: --典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的
: 优化,减少read fault
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: --对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit
: int,所以一般的机器内存也够了。
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟

b*******s
发帖数: 5216
46
相由心生,别人一看就不好意思问简单的 :)

【在 g**********y 的大作中提到】
: dongfei你是职业面试家还是怎么回事? :-)
: 我怎么看你各种公司,各种稀奇古怪的问题都被问到了。
:
: ,估
: ,
: 10

m********a
发帖数: 128
47
lz有答案吗?

,估
,
橙汁,最后它们体积仍然是10,问橙汁

【在 d********w 的大作中提到】
: 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
: 算时间
: 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
: latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
: 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
: 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

j**********g
发帖数: 204
48
楼主面的啥职位,是和big data有关的吗?
1 (共1页)
进入JobHunting版参与讨论
相关主题
有向图判断有无环这道计算几何题怎么做?
请教一个题目有谁知道quantcast的coding coding problem是什么吗
一个EDA的问题面经-facebook, amazon,telenav, quantcast
social 和 cloud 的公司怎么排?三道 Amazon Onsite Coding 题 (转载)
如何判断一个图中是否有环?请教一下超大图的存储问题
Amazon电面纪实发面经, 求祝福
检查graph里面是否有circle,是用BFS,还是DFS?GM面经
讨论一道图论题顶风狂发G面经,顺求bless
相关话题的讨论汇总
话题: 橙汁话题: 基站话题: 10话题: 咖啡话题: ip