由买买提看人间百态

topics

全部话题 - 话题: svm
首页 上页 1 2 3 4 5 6 7 8 9 10 (共10页)
h********3
发帖数: 2075
1
SVM的标准算法好像用KKT情况下线性不等式组,用simplex就可以解决了,可以不用
interior point method算法。
d*******g
发帖数: 51
2
纽约一家start up,几百人规模
总共三面,每次面试中间休息10分钟,onsite:
第一面:
问一些简单的hashtable,linkedlist,BST的优缺点
1)从一堆distinct, not continuing, increasing integers里面找出 value和index一
样的数,in sublinear time
2)实现windows 绘图板的 print 油漆桶功能函数 (类似DFS)
两道题都是现场白板,第一道秒杀,第二道提示了一下才做出来,原来canvas都是颜色
的二维数组
第二面:
聊了下简历的各种project很细,一直问到svm里面支持向量是怎么做判决的,我都是直
接调的libsvm,只知道个大概,然后就跪了
之后,bit manipulation, 把integer转成 string,不能用各种已有函数,然后问了
下各种情况,如何test,有没有overflow
然后一直问到了最底层,每个数的二进制码,这道题虽然简单但感觉是最虐的
第三面:这时候已经完全无力了
给了一道大题,把现在网站系统画出来,然后要加一个新功能,问:
1}新的 ... 阅读全帖
r*****d
发帖数: 346
3
这个面试真是全方位啊,从LeetCode的到svm到database. 佩服并祝好运!
w***y
发帖数: 6251
4
我自己遇到的比较多的是general的问题, 譬如有人问overfitting/regularization;
也有人问简单的MLE 或者MSE framework下的推导。 遇到过几次问learning算法的,不
过人家问我的是类似decision tree, logistic regression, svm之流的。 感觉HMM是
做NLP或者speech的人用的比较多的model吧。
有工作经验之后,会被问到类似design的问题,问选什么样的feature;missing
feature 怎么去处理; 最后怎么去evaluate 怎么选model
还有比较常遇到的是统计和概率的题目
a***n
发帖数: 3633
5
你不用犟。JobHunting版转行的人口中的CS不是computer science phd们的CS。
数据挖掘,AI,你还贝叶斯SVM呢,和人家找工作根本两码事。
d**e
发帖数: 6098
6
☆─────────────────────────────────────☆
zhenmajia (小破熊猫) 于 (Thu Jun 13 14:06:03 2013, 美东) 提到:
看了《别把CS神化了》
http://www.mitbbs.com/article_t/JobHunting/32450225.html
不吐不快。
我老就是文科转CS的,之前在那文科专业吭吭哧哧地学编程(Matlab)、学统计、学AI
,弄了一大堆东西,上课学得高深,AP教授push我累成狗,平时聚会一堆loser互相安
慰:谁谁谁去了伯克利当破似道,谁谁哪个教授虽然push但是出身名门,以后肯定有发
展之类。
幸好有兄弟们引路,不久就直接投奔CS,CS和EE的人说我“弃暗投明”。
当然,CS也不那么好学(这世界上除了富二代,哪个专业好学?),但是很简单明快,
只要坐住板凳、看书、认真编程,学不会恐怕很难吧?
CS的牛逼之处不在于“难”、“新”,而在于“实用”,就好比,厨子技术简单、思维
浅显,但是饿不死;搞哲学的民科们思维、深度比厨子强多了,但是饿得死。赚多少钱
、怎么赚不是根据能力考试... 阅读全帖
q****o
发帖数: 57
7
代别人发个position,VA
Charles Brinkman
Brinkman Executive Search
804-410-4238
www.linkedin.com/in/charlesbrinkman
MUST have published at one of these conferences:
KDD, ICML, ICM,ReCSYS AND ICDM are published with articles
Looking for a top end Machine Learning academic who LOVES publishing and
wants to work in an environment where he can work on massive data and build
algorithms and logic to drive Recommender Systems!
Basically this person will be researching/ working/ building the algorithms
and mat... 阅读全帖
g****x
发帖数: 223
8
来自主题: JobHunting版 - 如何阻止烙印来我们组
瞎出几点:跟你老板说,鉴于ICC的REPUTATION,为了能保障CANDIDATE确实能胜任我们
目前的工作,应该多问一些技术要点细节,例如何时用LINEAR REGRESSION VS
LOGISTIC;SVM VS LOGISTIC; AIC, or any Qs from your work. 如果你老板同意,
你可以自己出几道题和答案,然后发给你老板。You can also include some
programming Qs on data structures from leetcode.
这取决你老板,以及你和老板的关系。祝你好运!
l*******s
发帖数: 1258
9
组招NLPdeveloper,一年以上经验。
纽约midtown office,finance data领域。
要求:大体上跟其他developer要求差不多,比如算法数据结构啊,cs相关专业硕士及以
上啊之类的,在此不赘述。
特殊要求:了解并且能手工实现NLP和machine learning常用算法和模型,比如:
tokenizer,parser,named entity recognizer,Naive Bayes,KNN,Decision Tree
,SVM,HMM等。有意者请站内我。谢谢!
f****8
发帖数: 72
10
这几天认真的在版上刷帖子,看看过去人们是怎么准备面试的。
可是还是有一些问题不太明白,还是上来请教一下大家。
准备年底答辩,毕业,但是才开始准备找工作。我知道开始的晚了,有拖延重症的人啊
~~~
我的背景:
本科是生物,拿了个计算机的辅修
来美以后,拿了个生物信息的硕士,做的是蛋白结构方面的。
然后正在修了个计算机的博士,准备年底毕业。做的是抗药性的预测,期间也用了些
svm,ann,regression等。
关于coding能力,我上过java的课,教过python,博士期间工作是用matlab做的。但是
都没有系统的弄,只是用的时候去查查书而已。其他的一些语言,比如说mysql,php啥
的,也只是上课是做做project而已。上完课也就忘记了。
因为背景很杂,都不太清楚对什么工作比较match。但是据说match是很重要的~头疼ing
。。。现在初步想找data analyst/science的工作,(光看到它火了,估计会招人比较
多)。不知道大家有什么建议呢?
面试需要准备一些什么呢?
我现在的打算是focus on python和java。在codecademy上过一遍pyt... 阅读全帖
b****w
发帖数: 71
11
1. Data Scientist是在Search Science & Traffic的组,要求如下:
Job Description
• Excellent understanding of computer science fundamentals, data
structures, and algorithms. Experience in Java, Python or C++ is a
must.
• Experience in data mining and machine learning techniques like
feature extraction, decision tree, additive models, EM algorithm, SVM, etc
is a must.
• Experience in applied statistics including hypothesis testing,
analysis of variance, model evaluation, forca... 阅读全帖
h********g
发帖数: 496
12
来自主题: JobHunting版 - ebay applied researcher
面经就发在同一个thread吧
这是个back to back两小时的面试,两轮的流程都是先问了些简历的东西,然后对方介
绍下自己的项目,然后coding。
1. coding题很简单,可能是半research职位,所以coding要求不高?
1) 给一堆document, d1, d2, d3...dn,要求给出 reverse-index: <{word1,
frequence1}, {word2, frequence2} ...>
---document很多,reverse index没法都放在内存里头,所以讨论了下如何partition
---还讨论了下不同document的类型,word之间的delimter可能不同,document预处理等
2) find lowest common parent for two nodes in the tree.
follow question: what's your test cases?
3) print tree nodes in level order
2. machine learning 的题目: 你有很多customer... 阅读全帖
A*********c
发帖数: 430
13
本来我是带着娱乐的态度来回帖的,但是既然碰到了大牛,请educate我。
请告诉我任意一个数据结构,比inverted list 更重要,并且广泛地应用到了实际的
text retrieval system中.
请告诉我任意一个document retrieval model,比vector space model 或者 Okapi
BM25, Statistically significantly better for general purpose document
retrieval. Either implemented in Lucene or Lemur.
请告诉我任意一个clustering algorithm,other than Kmeans,will be your safe
first choice of clustering when you see some arbitrary data.
对于Classification,Old Stuff Like KNN works well in many cases. Kernel
algorithms are go... 阅读全帖
A*********c
发帖数: 430
14
本来我是带着娱乐的态度来回帖的,但是既然碰到了大牛,请educate我。
请告诉我任意一个数据结构,比inverted list 更重要,并且广泛地应用到了实际的
text retrieval system中.
请告诉我任意一个document retrieval model,比vector space model 或者 Okapi
BM25, Statistically significantly better for general purpose document
retrieval. Either implemented in Lucene or Lemur.
请告诉我任意一个clustering algorithm,other than Kmeans,will be your safe
first choice of clustering when you see some arbitrary data.
对于Classification,Old Stuff Like KNN works well in many cases. Kernel
algorithms are go... 阅读全帖
f*********2
发帖数: 48
15
Deep learning 是皇帝的新装。
与ANN有关的好的工作是 Neal 的 Bayesian NN 和 MacKay 等人的 Gaussian process。
不过,高维小样本,对什么方法都是个 坎儿。
另外,SVM离了核方法也不是那么牛叉。
严重同意楼主的观点,工业界更看中简单有效的方法,学术界的一些装逼理论一到实践
里就歇菜了。
f*********2
发帖数: 48
16
Deep learning 是皇帝的新装。
与ANN有关的好的工作是 Neal 的 Bayesian NN 和 MacKay 等人的 Gaussian process。
不过,高维小样本,对什么方法都是个 坎儿。
另外,SVM离了核方法也不是那么牛叉。
严重同意楼主的观点,工业界更看中简单有效的方法,学术界的一些装逼理论一到实践
里就歇菜了。
I*****D
发帖数: 133
17
来自主题: JobHunting版 - Rocket Fuel面经
phone interview,这大概是我面过的最奇葩的面试了,
问的是
Q. 你懂哪些data structure?
A. 愣了一下:tree, graph, map, ..
然后被打断 good good 问下一个
Q. 你懂哪些distribution?
A. Gaussian, Uniform, ...
然后good 继续下一个问题
Q. 你懂哪些算法
A. BFS, DFS,etc.
Q. 你懂哪些图算法
A. Dijkstra, Bellman-ford
Q. Tree有哪些
A. Binary Tree, Binary Search Tree, Black-Red, etc.
Q. 你对ML有什么了解
A. Regression, Classification, SVM,
。。。
等等都是非常概念性的问题,并不深究里边的东西,点到即止,没有一道程序题,感觉
只要拿着算
法书的目录照念就可以了
然后收到拒信
u*****o
发帖数: 1224
18
来自主题: JobHunting版 - Tower research 面经+ 扭腰一日游
答完这凶残的笔试后已经11点多了,我以为要去吃饭了。结果HR说下一个面试官马上来
。一会一个三哥风风火火的进来,拿着我的卷子说,咱们go over吧。我当时就眼前一
黑。。。
尤其是碰到mutex的题,他让我找deadlock,我吭吭哧哧找不到。三哥非常恼火,说你
找不到写在那干嘛呀。我又囧又急,根本focus不了,三哥在我旁边画小人和小汽车。
。。最后我瞎说到,两个pop function thread肯定要抢lock, 就僵局了,三哥就彻底
对我放弃治疗了。。。。
和HR一起吃饭时看来来往往的都是男的,我说你们有女trader吗,他说不算support
staff(accounting和hr)的话,就一个。。>_< 偶说我说下午还有几轮,他说至少一轮
。。我还挺高兴的,想一轮完了还应该挺早,我再去时代广场转转,还有法拉盛的羊肉
串和麻辣烫,几年前来时给我留下美好的印象。。所以我给自己打气,虽然笔试的很失
败,还跟自己说,不要想自己是一个生物女博士在面完全不熟悉的金融职位,而是萱萱
扮演的皇家大律师要上庭了,要踌躇满志,要积极自信,要意气风发,输人不输阵, 要
尽力面完这最后一轮就去... 阅读全帖
d**e
发帖数: 6098
19
来自主题: JobHunting版 - [合集] System design总结
☆─────────────────────────────────────☆
peking2 (scala) 于 (Tue Mar 19 14:28:11 2013, 美东) 提到:
1. System design 是一个很大的话题,大的System一般都是由Architect来设计的,因
此就算工作过若干年的也未必有很丰富的system design的经验。如果想对system
design有一个初步了解,我发现这个文章不错,http://www.palantir.com/2011/10/how-to-rock-a-systems-design-interview/
2. 因为我们jobhunting的主要目标集中在了FLGT等互联网公司,因此在这个范畴里的
system design也就集中在了分布式计算和分布式存储的design上了。想对这些设计理
念有个大体的了解可以读读Google的三驾马车,GFS, MapReduce和BigTable。
3. 有大牛建议读读各个公司的engineering blogs,我觉得是非常好的建议。不但能学
习system des... 阅读全帖
r**********g
发帖数: 22734
20
来自主题: JobHunting版 - deep learning到底是个什么
做过一点,属于二五眼。随便说说:
1. ANN这个玩意,一段时间就会火一次,因为硬件进步,以前不能算的,现在能算了。
DNN就是如此,接GPU的东风。
2. ANN这个玩意,拿来做classifier怎么样?不怎么样。为啥?因为overfit,层数多
了,可以拟合任何函数,没有regularization,没有推广性。
3. 为啥DNN火了?因为大家不用DNN做classifier了,开始拿他做feature extractor,
结果一用就灵,DNN可以把很难classify的空间投影到容易classify的空间,然后LR,
SVM随便上吧,用啥啥灵,解救了多少白发Ph.D。
4. DNN以后会怎么样?会成为标准的feature engineering方法,classifier呢,该干
嘛还是干嘛。
另外,说Speech recognition DNN取代HMM,的确是没有理解ASR。在声学模型里,比较
成功的DNN取代的是GMM,而HMM的结构没有变。在语言模型上,成功的是Minkov的RNN,
虽然可以支持无限长的历史,但是也无法完全取代ngram,一般放到一起用。
z******g
发帖数: 271
21
来自主题: JobHunting版 - 一道面试题,向本版求教一下。
看起来像分类问题,是不是可以用svm?
我瞎猜的,看看楼下怎么说
q********c
发帖数: 1774
22
来自主题: JobHunting版 - 一道面试题,向本版求教一下。
典型的机器学习问题,可用很多模型来套:NN, Bayesian Network, decision tree,
SVM好像overkill.
h*d
发帖数: 19309
23
来自主题: JobHunting版 - 工业界的机器学习 (转载)
SVM其实背后就是统计学方法的近似求解,不过ML很多做法还是超越了统计学范畴,附
一篇不代表个人观点的相关微博
@数据挖掘与数据分析
【基础知识:统计学和数据挖掘区别】统计学和数据挖掘有着共同的目标:发现数据中
的结构。事实上,由于它们的目标相似,一些人(尤其是统计学家)认为数据挖掘是统
计学的分支。这是一个不切合实际的看法。因为数据挖掘还应用了其它领域的思想、工
具和方法,尤其是计算机学科,例如数据库技术和机器学习
h*d
发帖数: 19309
24
来自主题: JobHunting版 - 工业界的机器学习 (转载)
SVM出来的hyperplane已经不好直觉了,SVD出来的东西就更无法直觉理解,前两年还是
ensemble效果最好,不知道最近两年TREC用什么的最好。
G**U
发帖数: 180
25
呵呵,这个就是围城啊……
backend就不是一个平台火三年了吗?
如果做工程,基本就是endless debugging,大公司内部功能类似的系统往往好几个,
相互之间pk,万一被deprecate掉几年辛苦也费了一大半,最多能有点经验积累。
如果做算法,不过就是找feature,run各种分类聚类预测实验,nb一点的会在svm之类
的现成包里面调调参数,绝大多数还是每天做各种数据萃取清洗转格式外加debug,辛
苦几个月把某指标提升几个百分点——还是运气好了,运气不好直接deprecate掉。
G**U
发帖数: 180
26
呵呵,这个就是围城啊……
backend就不是一个平台火三年了吗?
如果做工程,基本就是endless debugging,大公司内部功能类似的系统往往好几个,
相互之间pk,万一被deprecate掉几年辛苦也费了一大半,最多能有点经验积累。
如果做算法,不过就是找feature,run各种分类聚类预测实验,nb一点的会在svm之类
的现成包里面调调参数,绝大多数还是每天做各种数据萃取清洗转格式外加debug,辛
苦几个月把某指标提升几个百分点——还是运气好了,运气不好直接deprecate掉。
z****e
发帖数: 54598
27
来自主题: JobHunting版 - 奇特的面试题
big data的clustering题
而且是binary
svm应该是最有效的
u*****o
发帖数: 1224
28
来自主题: JobHunting版 - data scientist 都考哪些算法啊?
我试着补充两个, supervised learning下面的svm和 naive bayes
decision tree/random forest 有时间也看看吧, random forest碰到过一次。
p*********e
发帖数: 303
29
来自主题: JobHunting版 - data scientist 都考哪些算法啊?
kmeans, hierarchical clustering, spectral clustering.
logistic regression, svm, random forest, adboost.
不过现在kaggle上还是deep neural nets一统天下
j**********3
发帖数: 3211
30
来自主题: JobHunting版 - data scientist 都考哪些算法啊?
请问啥是svn, svn不是和git差不多的东西么?是想说svm么?
g*********e
发帖数: 14401
31
来自主题: JobHunting版 - data scientist 都考哪些算法啊?

打错了 svm
s****y
发帖数: 503
32
大数据开发是不是比J2EE工资高?我最近收到几个agent的email,大数据好像蛮热的。
关于大数据的软件开发工作需要知道哪些算法和理论?我了解HMM、SVM、神经网络什么
的,有没有什么讲义和资料全面地介绍大数据涉及的算法和理论?
z*****e
发帖数: 28
33
本人是 Biomedical Enineering phd, 学校还算不错,本人所在这个学校 BME 这个系
在全国算是很有名气,是传统的BME 科研非常好的学校。
我的背景具体是做神经信号记录和分析的,老板十分重视科研的scientific 价值,所
以发表的文章也不错,具体当然也是偏neural 方面的信号记录和处理。Phd 过程包括
做动物实验取生理信号,中途有时候悍一下电路,之后是信号处理,包括基本的滤波,
傅里叶变化之类的,然后用一些成型的machine learning 的算法, 像PCA,SVM 之类
的做做生理信号的clustering,非常基本。本科的时候采集并且处理过脑电信号,也发
表过区分脑电信号算法的会议论文。
临近毕业了,招工作,确实觉得这个方向目前工业界很窄,只有两三家公司在做,想找
一些偏信号处理和healthcare data的data scientist职位。自己研究生院上过random
signal, DSP 之类的课程,但是还是觉得自己在算法和machine learning 太弱了,也
在接着学。
求过来人指点指点,我这种情况应该怎么准备一下偏d... 阅读全帖
n*******1
发帖数: 145
34
感觉在ml应用会比mapreduce好 例如svm 因为单一数据小 不适合hadoop的64Mb chunk
I*******x
发帖数: 20
35
去年我找工作的时候发现板上针对data scientist,machine learning engineer面试
题总结很少,所以尽量申请了很多公司面试相关职位,想看看行业里这个方向都在问什
么。有幸去过不少地方面试,现在把那些题目整理整理(全部来自Amazon, Microsoft,
Yelp, Pinterest,
Square, Google, Glassdoor, Groupon的电面和onsite),希望能帮助在找相关工作的
同学们。
题目写的简略,请大家见谅
====================
1. Given a coin you don’t know it’s fair or unfair. Throw it 6 times and
get 1 tail and 5 head. Determine whether it’s fair or not. What’s your
confidence value?
2. Given Amazon data, how to predict which users are going to be top
shoppers ... 阅读全帖
I*******x
发帖数: 20
36
去年我找工作的时候发现板上针对data scientist,machine learning engineer面试
题总结很少,所以尽量申请了很多公司面试相关职位,想看看行业里这个方向都在问什
么。有幸去过不少地方面试,现在把那些题目整理整理(全部来自Amazon, Microsoft,
Yelp, Pinterest,
Square, Google, Glassdoor, Groupon的电面和onsite),希望能帮助在找相关工作的
同学们。
题目写的简略,请大家见谅
====================
1. Given a coin you don’t know it’s fair or unfair. Throw it 6 times and
get 1 tail and 5 head. Determine whether it’s fair or not. What’s your
confidence value?
2. Given Amazon data, how to predict which users are going to be top
shoppers ... 阅读全帖
m*******o
发帖数: 11
37
本人背景:
CS phd, 研究方向Machine Learning和Bioinformatics。 主要是Deep learning算法
与其他算法的结合。
在Blizzard做过Data Science实习。
Core skills: Classification, Clustering, Data Visualization, Support Vector
Machines (SVM), Decision Trees, Bayesian network, Logistic Regression,
Linear Regression, Hidden Markov Model (HMM), Statistics, Recommendation
Systems, Information Retrieval, Hadoop, Deep Learning and Deep Neural
Networks.
h********3
发帖数: 2075
38
几乎没什么需求。只有超高维度的数据才需要deep learning,比如图像和音频。如果
你预先做做人工feature reduction,然后用svm或者logistic regression一样可以跑
出不错的结果。
事实上,工业界用超高维度做learning本来就是一件不靠谱的事情。如果你的learning
system非要用几百million甚至更多的feature去学习,说明你需要多花花功夫在
feature engineering,而不是纠结于用什么learning算法。你不做feature
engineering,即便学出来一个很不错的model,你也无法去解释。不能解释的model等
于没有model。
t*******e
发帖数: 127
39
最近可能要去G家面ba的position.组是Google Wallet Business Intelligence team.
我现在是在金融机构做data analyst,skill set主要
就是sql和sas,加上统计科班出生,学过machine learning,短时间应该可以加强一下。
我个人总结了一下这一类职位可能会问到问题有下面几种:
1. business case。类似于consulting firm的面试
2. statistics/probability。比如说简单的方差分布,假设检验,回归分析
3. Machine Learning。简单的话谈谈对logistic regression,svm,decision tree的了
解,再深入的话感觉BA应该不会问到
4. SQL。这个肯定是会重点考察的
5. 算法题。这个应该data scientist才会考吧?
6. BI TOOL。因为是在BI组,会不会考对microstrategy, tableau,甚至是EXCEL VBA的
了解呢?
7. Brainteaser
想请问一下各位最近面过G家类似职位的同学... 阅读全帖
e*********5
发帖数: 137
40
电面持续 1小时。 开始是问machine learning的基础, supervise learning and
unsupervised learning的区别,SVM的原理(包括如何得到model,如果data是完全被超
平面可分如何,如果有outlier怎么办,如果boundary不是平面怎么办,kernel背后有
什么意义?) 接下来coding:
1 给一个数组,把0都已到最后面。不需要stable。非常简单。
{ 1,2,3, 4,0, 0, 9, 6, 3, 1,0}
return
{ 1,2,3, 4, 9, 6, 3, 1,0,0, 0}
2. 给一个有序数组, 返回一个balanced BST.LeetCode原题。
3。 OOP的一些概念,关于exception, constructor, destructor. 就是应不应该在
destructor里面处理 exception,如果class 有多个变量需要分配内存,constructor对
某些变量分配内存超出,分配内存不成功怎么办,destructor还会不会执行等等?
第三问可能达的没有特别好,求bles... 阅读全帖
m*******o
发帖数: 11
41
来自主题: JobHunting版 - Google PhD Intern, 求Host Match
计算机非牛校senior phd, 研究方向Machine Learning。
做过Data Science实习。
语言Python, Java, C++
熟悉Classification, Clustering, Data Visualization 比如SVM, Logistic
Regression, Linear Regression, Bayesian Networks,Decision Tree, Statistics
, Recommendation Systems and Deep Learning算法. 有Distributed computing和
Information Retrieval的经验。
谢谢
d****y
发帖数: 58
42
来自主题: JobHunting版 - apple data scientist面经
first phone interview:
聊聊简历,聊聊outlier detection.
SVM为什么选择maximal margin. Classification如果两个cluster数量差不多怎么样,
数量相差悬殊怎么样。
second phone interview:
coding question: judge if linkedlist has a cycle.
linux question: about grep.
very simple sql question, cannot remember now.
onsite interview.
1. need to do presentation. 做完presentation就让我走人了。说不match.
话说当时说让我随便找个research project讲讲。
w*****h
发帖数: 423
43
来自主题: JobHunting版 - ebay 研究科学家是怎么个面试法
今天刚面完一面,
问了k-means, hierarchical clustering, svm, boosting的原理等等。
接下来的面试会问啥?
s*******y
发帖数: 52
44
我们主要做predictive modeling,整个datalab发展的很好,组里气氛也很好,很多强
人,大多数是phd, 待遇在
sd很不错, 最好是local或者距离近一些(LA) 的candidates,或者如果你很强,而且真
想到San
Diego来,也可以看下。可以站内给我发信,请简单介绍自己,我会给你我的邮箱
, 不错的简历我会forward给manager。我不是hr,所
以不太好把邮箱直接留在这,请见谅。
理工科的phd都可以申请,具体专业没有限制,需要你熟悉machine learning和统计,
人聪明,编程好,数学好。很强的master也可以考虑申请。
Scientist - Predictive Modeling at Experian North America R&D Data Lab
Experian DataLabs is a R&D unit at Experian formed with the desire to work
in collaboration with Experian’s business units to enhance rel... 阅读全帖
m*******4
发帖数: 34
45
来自主题: JobHunting版 - data science 面试求教
本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
聊的实验室项目, 他们挺感兴趣。
我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
发了个 data science challenge.
预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
置, 距离城里多远,有数字类型的, 也有categorical 的。
然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
要求一周内做出来,
提交代码。描述模型, 选的什么软件, 什么包
何种算法, 怎样选feature, 为什么
怎样分析模型的 accuracy , 用什么方法,为什么选这个方法
那个feature 影响高, 那个影响低, 用什么方法找的。
数据有错误, 要求清洗, 哪些清洗时必要的
---------------------------------
我们实验室就是用用 naive bayes, SVM 啥的。 没人真懂。
我觉得这是回归不是分类。 我上统计课的时候知道些线性回归的皮毛。
觉得... 阅读全帖
p*****r
发帖数: 1883
46
我当时面一个数据科学的职位,问机器学习问题,对方老印用浓重chennai口音问我
What is the difference between SVD and SVM?
o*******4
发帖数: 313
47
来自主题: JobHunting版 - 讨论几个面试题

声明:不是data scientist。data scientist面试都求不到…… 我来瞎蒙。
human label instances -> extract text features from documents -> assign
weights of importance of each feature from the document using things like tf
-idf, also pay attention to position of the text feature (url term, title
term...etc) -> train an svm model using some labeled data -> evaluate model
precision recall and f score using hold off set data.
什么数据?用什么模型?
- Use existing ratings and product similarity to estimate future ratings
- Collaborat... 阅读全帖
p*****r
发帖数: 1883
48
毕竟是比较新的行业,没有什么确切定义,也因为这个行业涉猎广泛,问这些都是合理
的,都得会一点
你都还没有被老印PM问过SVD和SVM的区别呢
p*****r
发帖数: 1883
49

我是举个例子说SVD与SVM的区别才是瞎问啊
g****e
发帖数: 1829
50
哈哈。svd svm
lol
首页 上页 1 2 3 4 5 6 7 8 9 10 (共10页)