由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 问一道data engineer面试题,跪求答案
相关主题
热腾腾的google analyst 面试题跪求谈包裹策略:跳槽微软 Data Scientist 2
请教一道面试题面试题请教
跪求推荐做学位认证的公司Foreign Studies Equivalency Cert跪求microsoft内推机会。。。。
请教一下有没有人了解Azure Data Team贡献一个MS onsite面试题
问个mutex的面试题Tricky Pointer Problems -- Which level are you?
一道G的面试题。除了某家之外,讨论个F的面试题吧,merge 2D interval
面试题 finding missing value大家帮我看看这个题,给个思路
跪求big data/hadoop内推。Amazon电面两题
相关话题的讨论汇总
话题: data话题: point话题: feature话题: 跪求话题: equivalent
进入JobHunting版参与讨论
1 (共1页)
i**********n
发帖数: 196
1
有A与B两个集合,每个集合各含有million个data point,每个data point由thousand
个feature描述,不过有的feature是missing的或者残缺不全的。已知有一个方程f(a,b
)可以判断两个data point a和b是否equivalent,问题是如何最efficient的找出A与B
中的所有equivalent的data point对。
跪求答案。
t*****3
发帖数: 112
2
唉,我要是被问到这个问题多好啊。如果所有feature的值的范围可以标准化到一个范
围,比如1到5之间,可以用matrix factorization为每个data point和每个feature各
计算一个vector出来,然后就可以估计每个data point的missing features的值,然后
就可以用f(a,b)来计算equivalent了。注意matrix factorization那一步是可以做到
linear的,参见netflix prize的winning team的成果。

thousand
,b
B

【在 i**********n 的大作中提到】
: 有A与B两个集合,每个集合各含有million个data point,每个data point由thousand
: 个feature描述,不过有的feature是missing的或者残缺不全的。已知有一个方程f(a,b
: )可以判断两个data point a和b是否equivalent,问题是如何最efficient的找出A与B
: 中的所有equivalent的data point对。
: 跪求答案。

i**********n
发帖数: 196
3
ls是大牛!待我膜拜下这个solution先
1 (共1页)
进入JobHunting版参与讨论
相关主题
Amazon电面两题问个mutex的面试题
新码工请教如何处理修bug和开发features (转载)一道G的面试题。
Evaluating A Job Offer zz面试题 finding missing value
报个微软的Offer跪求big data/hadoop内推。
热腾腾的google analyst 面试题跪求谈包裹策略:跳槽微软 Data Scientist 2
请教一道面试题面试题请教
跪求推荐做学位认证的公司Foreign Studies Equivalency Cert跪求microsoft内推机会。。。。
请教一下有没有人了解Azure Data Team贡献一个MS onsite面试题
相关话题的讨论汇总
话题: data话题: point话题: feature话题: 跪求话题: equivalent