由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - Amazon data scientist面经
相关主题
分享总结的G家统计面经如何阻止烙印来我们组
数学phd求refer, Statistician/Data Scientist/Predictive Modeler/Risk analyst相关我也来贡献几个面试题
请问想找data scientist 工作应该怎么开始准备 (转载)报面筋求实习合租
报个电面面经,估计没戏了请问logistic regression有哪些hyperparameter (转载)
Amazon面经麻烦问下, 有电面,onsite后再一轮电面的么? 请教下
L家onsite悲剧 贡献个面经吧Palantir Embedded Analyst面经
包子请问:银行面试问题 (统计)C1 电话面经
quantcast和storm8电面和code challenge面经data scientist职位interview一般都问什么?
相关话题的讨论汇总
话题: amazon话题: 相关话题: 问题话题: 面经话题: 分类器
进入JobHunting版参与讨论
1 (共1页)
p*****9
发帖数: 273
1
被放过一次鸽子 重新安排之后有人打进电话 烙印
(按时间顺序)
1. 他介绍组
2. 介绍我自己
3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。
4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样
本非常少。围绕这这个项目,问了很多问题
1)怎么处理这种unbalanced的数据
2)怎么给数据降维
3)哪些分类器可以选择
4)logistic regression的相关问题
5)decision tree的相关问题
6)random forest的相关问题
7)confusion matrix及相关指标相关问题
8)分布式logistic regression计算的相关问题 如何online
整个面试过程还是蛮中规中矩。烙印问的题也大多是基本题。有的知道,有的不清楚他
也给来些提示 有一点奇怪的就是 有时候他竟然自问自答 刚把题目问了你还没来得及
回答 他就把答案说了 不知道是不是在黑我 最后说一两周之后给结果 不知道结果怎么
p**t
发帖数: 157
2
答:C不熟。 要求用C写几个操作
为什么这么喜感。。。

【在 p*****9 的大作中提到】
: 被放过一次鸽子 重新安排之后有人打进电话 烙印
: (按时间顺序)
: 1. 他介绍组
: 2. 介绍我自己
: 3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。
: 4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样
: 本非常少。围绕这这个项目,问了很多问题
: 1)怎么处理这种unbalanced的数据
: 2)怎么给数据降维
: 3)哪些分类器可以选择

m********a
发帖数: 128
3
第一问怎么答啊?
怎么处理这种unbalanced的数据?

【在 p*****9 的大作中提到】
: 被放过一次鸽子 重新安排之后有人打进电话 烙印
: (按时间顺序)
: 1. 他介绍组
: 2. 介绍我自己
: 3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。
: 4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样
: 本非常少。围绕这这个项目,问了很多问题
: 1)怎么处理这种unbalanced的数据
: 2)怎么给数据降维
: 3)哪些分类器可以选择

n*****3
发帖数: 1584
4
sample the negative population to make they balanced?

【在 m********a 的大作中提到】
: 第一问怎么答啊?
: 怎么处理这种unbalanced的数据?

a********3
发帖数: 180
5
如果0的个数有m0个,1的个数有m1个,
0/1 在写目标函数时分别用 0*m1, 1*m0 来代替,以平衡数据量。
多谢lz,楼主投了多久后得到面试的? 等到了下一轮回来跟新哈。

【在 m********a 的大作中提到】
: 第一问怎么答啊?
: 怎么处理这种unbalanced的数据?

p*****9
发帖数: 273
6
我是去年10月14日投的
嗯 希望有下一轮 先move on了

【在 a********3 的大作中提到】
: 如果0的个数有m0个,1的个数有m1个,
: 0/1 在写目标函数时分别用 0*m1, 1*m0 来代替,以平衡数据量。
: 多谢lz,楼主投了多久后得到面试的? 等到了下一轮回来跟新哈。

E*******F
发帖数: 2165
7
请问楼主这个是在西雅图的职位吗?
s**********4
发帖数: 59
8
没看懂,能不能解释得具体一点?

【在 a********3 的大作中提到】
: 如果0的个数有m0个,1的个数有m1个,
: 0/1 在写目标函数时分别用 0*m1, 1*m0 来代替,以平衡数据量。
: 多谢lz,楼主投了多久后得到面试的? 等到了下一轮回来跟新哈。

g********k
发帖数: 838
9
对,这些都是比较standard的 question。

【在 p*****9 的大作中提到】
: 被放过一次鸽子 重新安排之后有人打进电话 烙印
: (按时间顺序)
: 1. 他介绍组
: 2. 介绍我自己
: 3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。
: 4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样
: 本非常少。围绕这这个项目,问了很多问题
: 1)怎么处理这种unbalanced的数据
: 2)怎么给数据降维
: 3)哪些分类器可以选择

1 (共1页)
进入JobHunting版参与讨论
相关主题
data scientist职位interview一般都问什么?Amazon面经
非cs专业找相关工作有必要修个cs的学位么?L家onsite悲剧 贡献个面经吧
回报版面:Google Quant Analyst面经包子请问:银行面试问题 (统计)
Offer 太烂了! 附:面经(挂羊头卖羊肉)quantcast和storm8电面和code challenge面经
分享总结的G家统计面经如何阻止烙印来我们组
数学phd求refer, Statistician/Data Scientist/Predictive Modeler/Risk analyst相关我也来贡献几个面试题
请问想找data scientist 工作应该怎么开始准备 (转载)报面筋求实习合租
报个电面面经,估计没戏了请问logistic regression有哪些hyperparameter (转载)
相关话题的讨论汇总
话题: amazon话题: 相关话题: 问题话题: 面经话题: 分类器