p*****9 发帖数: 273 | 1 被放过一次鸽子 重新安排之后有人打进电话 烙印
(按时间顺序)
1. 他介绍组
2. 介绍我自己
3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。
4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样
本非常少。围绕这这个项目,问了很多问题
1)怎么处理这种unbalanced的数据
2)怎么给数据降维
3)哪些分类器可以选择
4)logistic regression的相关问题
5)decision tree的相关问题
6)random forest的相关问题
7)confusion matrix及相关指标相关问题
8)分布式logistic regression计算的相关问题 如何online
整个面试过程还是蛮中规中矩。烙印问的题也大多是基本题。有的知道,有的不清楚他
也给来些提示 有一点奇怪的就是 有时候他竟然自问自答 刚把题目问了你还没来得及
回答 他就把答案说了 不知道是不是在黑我 最后说一两周之后给结果 不知道结果怎么
样 |
p**t 发帖数: 157 | 2 答:C不熟。 要求用C写几个操作
为什么这么喜感。。。
【在 p*****9 的大作中提到】 : 被放过一次鸽子 重新安排之后有人打进电话 烙印 : (按时间顺序) : 1. 他介绍组 : 2. 介绍我自己 : 3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。 : 4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样 : 本非常少。围绕这这个项目,问了很多问题 : 1)怎么处理这种unbalanced的数据 : 2)怎么给数据降维 : 3)哪些分类器可以选择
|
m********a 发帖数: 128 | 3 第一问怎么答啊?
怎么处理这种unbalanced的数据?
【在 p*****9 的大作中提到】 : 被放过一次鸽子 重新安排之后有人打进电话 烙印 : (按时间顺序) : 1. 他介绍组 : 2. 介绍我自己 : 3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。 : 4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样 : 本非常少。围绕这这个项目,问了很多问题 : 1)怎么处理这种unbalanced的数据 : 2)怎么给数据降维 : 3)哪些分类器可以选择
|
n*****3 发帖数: 1584 | 4 sample the negative population to make they balanced?
【在 m********a 的大作中提到】 : 第一问怎么答啊? : 怎么处理这种unbalanced的数据?
|
a********3 发帖数: 180 | 5 如果0的个数有m0个,1的个数有m1个,
0/1 在写目标函数时分别用 0*m1, 1*m0 来代替,以平衡数据量。
多谢lz,楼主投了多久后得到面试的? 等到了下一轮回来跟新哈。
【在 m********a 的大作中提到】 : 第一问怎么答啊? : 怎么处理这种unbalanced的数据?
|
p*****9 发帖数: 273 | 6 我是去年10月14日投的
嗯 希望有下一轮 先move on了
【在 a********3 的大作中提到】 : 如果0的个数有m0个,1的个数有m1个, : 0/1 在写目标函数时分别用 0*m1, 1*m0 来代替,以平衡数据量。 : 多谢lz,楼主投了多久后得到面试的? 等到了下一轮回来跟新哈。
|
E*******F 发帖数: 2165 | |
s**********4 发帖数: 59 | 8 没看懂,能不能解释得具体一点?
【在 a********3 的大作中提到】 : 如果0的个数有m0个,1的个数有m1个, : 0/1 在写目标函数时分别用 0*m1, 1*m0 来代替,以平衡数据量。 : 多谢lz,楼主投了多久后得到面试的? 等到了下一轮回来跟新哈。
|
g********k 发帖数: 838 | 9 对,这些都是比较standard的 question。
【在 p*****9 的大作中提到】 : 被放过一次鸽子 重新安排之后有人打进电话 烙印 : (按时间顺序) : 1. 他介绍组 : 2. 介绍我自己 : 3. 会不会A, 会不会B,会不会C。 答:C不熟。要求用C写几个操作。 : 4. 要求设计一个分类器。数据是10M个点,每个点15k的feature,输出时0/1。 阳性样 : 本非常少。围绕这这个项目,问了很多问题 : 1)怎么处理这种unbalanced的数据 : 2)怎么给数据降维 : 3)哪些分类器可以选择
|