由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - F家DS,analytics电面面经,贡献一个sql相关 (转载)
相关主题
【求助】求Facebook DS 电话面试和onsite面经高大上的数据工程师培训来了 Analytic Bootcamp Openhouse event
请教一下SQL的资料说说Facebook的Data Scientists职位 (转载)
新出炉的FB面经请教个build data analytics engine的问题
Twitter Data Scientist 电面题目Hive的表里面的timestamp类型数据,怎么显示?
SQL某startup面经,顺便求指点 (转载)Data scientist--Zillow电面
Re: 攒人品,发Google Statistician/Data Scientist电面面经请教一个面试题(已跪)
求一本书:Data Science for Business推荐个英文网站Date Science Central
数学phd可以再读一个cs的master,偏向data analytics?下周面A和L的data scientist and data engineer. 有没有面经?一般问些啥?
相关话题的讨论汇总
话题: dice话题: answer话题: num话题: show话题: 出现
进入DataSciences版参与讨论
1 (共1页)
c****t
发帖数: 19049
1
【 以下文字转载自 Database 讨论区 】
发信人: coolbid (Dreams bring hopes), 信区: Database
标 题: F家DS,analytics电面面经,贡献一个sql相关 (转载)
发信站: BBS 未名空间站 (Mon Mar 10 10:56:20 2014, 美东)
发信人: p0830 (AnnieJ), 信区: JobHunting
标 题: F家DS,analytics电面面经,贡献一个sql相关
发信站: BBS 未名空间站 (Sun Mar 9 17:51:08 2014, 美东)
因为太弱了所以面试官都没接着问,火急火燎地敷衍了我一下半小时不到就挂电话了。。
估计十分失望。。
这个职位在data&analytics部门下不是sde所以主要考sql,面试官说sde部门的会主要
关注python。
电话打过来先问了为什么喜欢fb,接着马上on-line coding, 原题如下:
survey_log (uid, action, question_id, answer_id, q_num, timestamp)
action = 'show', 'answer', 'skip'
answer_id = when action=answer, null for skip and show
q_num is the numeral/order of the question in the session
uid, eventtype, quid, aid, qorder, timestamp
5, 'show', 285, null, 1, 141425411
5, 'answer', 285, 124124, 1, 141425415
5, 'show', 369, null, 2, 141425416
5, 'skip', 369, null, 2, 141425417
1. write a sql query to identify the one question that has the highest
answer rate
看样子本来准备1,2,3好几道题目的,但这一题就卡了20分钟都没做出来面试管无奈
了。。。现在想想应该问他能不能用R,sql就只用过一个星期还是巨简单的应用。。跪
。。。
那边看我做不出来就说我们换点analytics来做做吧,然后就问我扔两个dice,至少一
个4出现的概率是多少。。我都惊呆了。。这果然是不想再跟我纠缠下去的意思的吧,
,结果我还好死不死的算错了呵呵呵呵呵,= =。。。前面被打击得信心全无。。
哎,,,
f***w
发帖数: 30
2
有几种解法,不用join的话可以用case statement. 以hive ql为例:
select question_id,(num_answer / num_show) answer_rate
from
(
select question_id, count(case when action = 'show' THEN 1 ELSE 0 END) AS
num_show, count(case when action = 'answer' THEN 1 ELSE 0 END) AS num_answer
from survey_log
group by question_id
)a
order by (num_answer / num_show) desc limit 1;
g****l
发帖数: 213
3
dice那个是1/6 + 1/6吗?
m**********7
发帖数: 9
4
应该是1/6 +1/6 - (1/6)*(1/6)=11/36

【在 g****l 的大作中提到】
: dice那个是1/6 + 1/6吗?
H******s
发帖数: 263
5
dice那题是1/6*1 + 5/6×1/6 = 11/36吗。就是先考虑dice1得到4的概率,再相应考虑
dice2.
楼上的 1/6 + 1/6 -1/6*1/6 我一下子理解不来,能解释一下。
sql题,最简单的做法应该是join两个Subquery, 一个count(*) group by qid having
eventtype="show"统计总数,另一个count(*) group by qid having aid is not null
统计回答数。最后Select qid, ifnull(num_ans, 0)/num_show. 注意要left join, 因
为num_answer可能是零,完全不出现在右边。而且select时要用ifnull处理一下。
M*Q
发帖数: 54
6
1/6 + 1/6 - 1/6*1/6就是两个dice分别是4的概率相加,再减去同时是4的概率

having
null

【在 H******s 的大作中提到】
: dice那题是1/6*1 + 5/6×1/6 = 11/36吗。就是先考虑dice1得到4的概率,再相应考虑
: dice2.
: 楼上的 1/6 + 1/6 -1/6*1/6 我一下子理解不来,能解释一下。
: sql题,最简单的做法应该是join两个Subquery, 一个count(*) group by qid having
: eventtype="show"统计总数,另一个count(*) group by qid having aid is not null
: 统计回答数。最后Select qid, ifnull(num_ans, 0)/num_show. 注意要left join, 因
: 为num_answer可能是零,完全不出现在右边。而且select时要用ifnull处理一下。

l*******m
发帖数: 1096
7
1 - (5/6) (5/6) = 11/36
s********n
发帖数: 41
8
interview状态下,基本上就是考第一感觉了。通常是一紧张,会得也不会了,不会的
还是不会。
n****e
发帖数: 107
9
mysql不知道对不对
select max(c) from (select sum(case when action = 'answer' THEN 1 ELSE 0 END
)/sum(case when action = 'show' THEN 1 ELSE 0 END) as c from survey_log
group by question_id) as s
d*****g
发帖数: 4364
10
这个概率就是给你放水的

。。

【在 c****t 的大作中提到】
: 【 以下文字转载自 Database 讨论区 】
: 发信人: coolbid (Dreams bring hopes), 信区: Database
: 标 题: F家DS,analytics电面面经,贡献一个sql相关 (转载)
: 发信站: BBS 未名空间站 (Mon Mar 10 10:56:20 2014, 美东)
: 发信人: p0830 (AnnieJ), 信区: JobHunting
: 标 题: F家DS,analytics电面面经,贡献一个sql相关
: 发信站: BBS 未名空间站 (Sun Mar 9 17:51:08 2014, 美东)
: 因为太弱了所以面试官都没接着问,火急火燎地敷衍了我一下半小时不到就挂电话了。。
: 估计十分失望。。
: 这个职位在data&analytics部门下不是sde所以主要考sql,面试官说sde部门的会主要

Z******a
发帖数: 1178
11
总结一下dice题,虽然简单,但是很基本:
solution 1: 1-P(两个dice都没有出现4)=1-5/6*5/6
solution 2: 穷举所有出现4的情况:
P(A dice出现4 and B dice 没有出现4) + P(A dice没有出现4 and B dice 出现4) +
P(A dice出现4 and B dice 出现4) = 1/6*5/6 + 1/6*5/6 + 1/6*1/6
solution 3: addition law : P(A dice 出现4 or B dice 出现4) = P(A dice 出现4)
+ P(B dice 出现4) - P(A dice 出现4 and B dice 出现4) = 1/6 + 1/6 - 1/6*1/6
面试的时候,解法一是王道,遇到这种至少***的情况,就赶紧要翻译成1-什么都没有。
1 (共1页)
进入DataSciences版参与讨论
相关主题
下周面A和L的data scientist and data engineer. 有没有面经?一般问些啥?SQL某startup面经,顺便求指点 (转载)
讨论一下data science 项目 (转载)Re: 攒人品,发Google Statistician/Data Scientist电面面经
能有个QQ或者微信群吗?求一本书:Data Science for Business
杂七杂八的一些面经 (转载)数学phd可以再读一个cs的master,偏向data analytics?
【求助】求Facebook DS 电话面试和onsite面经高大上的数据工程师培训来了 Analytic Bootcamp Openhouse event
请教一下SQL的资料说说Facebook的Data Scientists职位 (转载)
新出炉的FB面经请教个build data analytics engine的问题
Twitter Data Scientist 电面题目Hive的表里面的timestamp类型数据,怎么显示?
相关话题的讨论汇总
话题: dice话题: answer话题: num话题: show话题: 出现