由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - [网flix]面经
相关主题
那道求两大文件交集的G题[hortonworks面经] senior hadoop engineer
G家mapreduce一道题G家电面题
G家面经,求bless关于学习 Hadoop , 求指点
一道大数据题,求最优解。请问如何准备data scientist工作面试?
请教可以在线练习 map reduce 的地方?还有一周onsite,怎么看Hadoop.The.Definitive.Guide效率最高?
简单map reduce mean median, 傻逼回答问有没有mapreduce,hadoop,hbase经验怎么处理?
Amazon组选择:EC2还是Elastic MapReduceSDE position available in a New Jersey based data center networking startup
hadoop面试和学习总结前员工追忆百度乱象:上下异心 狼性压制人性(转载)
相关话题的讨论汇总
话题: courseid话题: hadoop话题: group话题: mapred话题: studentid
进入JobHunting版参与讨论
1 (共1页)
H***e
发帖数: 476
1
1。很多hadoop相关的问题,mapred整个流程,碰到过的出现的问题,设计有什么flaws
, hadoop和relational db的比较; speculative execution, 我知道这个机制,但是没
有跟名字对上号..就说没听说过。
2。mapreduce怎么实现select count group by; 如何一次mapred实现两个group by
(stduentId, courseId)
select count * from table group by studentId;
select count * from table group by courseId;
3。两个element加起来target的经典题
4。实现一个Boundedqueue,threadsafe,并且最佳化性能。
都答出来了,但是hadoop那些模糊问题的就答得不好。
d********w
发帖数: 363
2
赞,关于第二题在hadoop中有个叫secondary sort,
在parittion时候可以使得键值组成的key,同样的键在同一个分区中。这样行么
map:
emit(pair, value>
partition:
super.partition(key.get(1))

flaws

【在 H***e 的大作中提到】
: 1。很多hadoop相关的问题,mapred整个流程,碰到过的出现的问题,设计有什么flaws
: , hadoop和relational db的比较; speculative execution, 我知道这个机制,但是没
: 有跟名字对上号..就说没听说过。
: 2。mapreduce怎么实现select count group by; 如何一次mapred实现两个group by
: (stduentId, courseId)
: select count * from table group by studentId;
: select count * from table group by courseId;
: 3。两个element加起来target的经典题
: 4。实现一个Boundedqueue,threadsafe,并且最佳化性能。
: 都答出来了,但是hadoop那些模糊问题的就答得不好。

H***e
发帖数: 476
3
我就说了最简单的,每次map emit两次, 一次key studentID value courseId
一次key course, value student, 最后都柔和在一个文件里了,再做些post
processing。 他说good,也没说有问题.

【在 d********w 的大作中提到】
: 赞,关于第二题在hadoop中有个叫secondary sort,
: 在parittion时候可以使得键值组成的key,同样的键在同一个分区中。这样行么
: map:
: emit(pair, value>
: partition:
: super.partition(key.get(1))
:
: flaws

w**z
发帖数: 8232
4
面的啥职位啊?

flaws

【在 H***e 的大作中提到】
: 1。很多hadoop相关的问题,mapred整个流程,碰到过的出现的问题,设计有什么flaws
: , hadoop和relational db的比较; speculative execution, 我知道这个机制,但是没
: 有跟名字对上号..就说没听说过。
: 2。mapreduce怎么实现select count group by; 如何一次mapred实现两个group by
: (stduentId, courseId)
: select count * from table group by studentId;
: select count * from table group by courseId;
: 3。两个element加起来target的经典题
: 4。实现一个Boundedqueue,threadsafe,并且最佳化性能。
: 都答出来了,但是hadoop那些模糊问题的就答得不好。

1 (共1页)
进入JobHunting版参与讨论
相关主题
前员工追忆百度乱象:上下异心 狼性压制人性(转载)请教可以在线练习 map reduce 的地方?
大家如何选择offer呢?简单map reduce mean median, 傻逼回答
想想马工真可粘,听说Hadoop 2.0转型以后大家的知识都陈旧了Amazon组选择:EC2还是Elastic MapReduce
不懂map reduce去面flg会怎样hadoop面试和学习总结
那道求两大文件交集的G题[hortonworks面经] senior hadoop engineer
G家mapreduce一道题G家电面题
G家面经,求bless关于学习 Hadoop , 求指点
一道大数据题,求最优解。请问如何准备data scientist工作面试?
相关话题的讨论汇总
话题: courseid话题: hadoop话题: group话题: mapred话题: studentid