由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 找工作总结 [下]
相关主题
data science 面试求教问大牛们一个logistic model的问题哈
good classification methods for high dimension data报面筋求实习合租 (转载)
model的predictors之间有multi-colinearity怎么办?SVM和logistic regression 的比较
【大包子】Factor data analysisT家面试题目求解答~~
logistic regression结果释疑,解读关于stepwise programming
Principal Components Analysis 中 factor 选择的问题电话面试完了,肯定没戏,大家帮我看看题目,就算学习吧
求助:即将遭遇统计的第一个电话面试抓狂!为啥选出来的predictor都这么差
感慨一下,学校的知识在实际工作中好苍白,求教两个困惑我许久的实际问题请问:想fit gamma 并同时用lasso的方法做variable selection
相关话题的讨论汇总
话题: 8232话题: model话题: data话题: modeling话题: 问题
进入Statistics版参与讨论
1 (共1页)
A*******s
发帖数: 3942
1
先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。


言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:


1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。


2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。


3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。


4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。


5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。


6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;

我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


1. 回答要有层次。举个例子, how to do model selection? 比较一下这三个答案

A: I use forward/backward/stepwise... blah blah....


B: I know three methods, subset selections(forward/backward/stepwise), PCA, shrinkage method
(ridge/LASSO). I prefer PCA....blah blah....


C: Many people used to prefer forward/backward/stepwise because of its easy computation and straightforward interpretation. However it has some severe problems, e.g. unstable estimations and unable to deal with multicollinearity. Harrell's 2001 paper has detailed discussion. I personally prefer PCA, if there is a good interpretation for those principle components. If it's not the case, shrinkage method may be a better choice. Ridge regression offers a biased but less-variance prediction, however it is not really about "selection" since its shrinking process is continuous. Instead, LASSO truncates some coefficients at 0 and thus discards those correspondent variables, blah...blah....I usually implement those methods in Proc glmselect, blah... blah... However, the most important are the stories behind the data. Instead of using some fancy statistical stuff, some experts knowledge and business context are more necessary for selecting the right model. blah, blah.......


interviewer喜欢那个版本的答案应该很清楚了,组织一个既有深度和广度,又有条理的答案会有很大加分。当然这个只 是一个例子,我的水平还不够写出足够有深度的答案,希望大牛们可以就这个问题发表自己看法。


2. 一定要准备好问interviewer的问题。


可以反问一些技术问题,比如说,你们在实际中是怎么搞model selection的(有个HM有点尴尬地说他们就在用stepwise, 在我说了stepwise的一堆缺点之后), 你们怎么evaluate models, etc... 

在这里需要严重指出的是,咱们中国人比老美或者阿三强的就是技术,所以在面试里要最大程度地表现出自己的技术优势。但是,不是每个interviewer都有备而来,他们可能只准备了一些很简单的TQ,让你的技术优势无从体现。这时候可以反问一些他们没有问的技术问题,然后在相互讨论中将准备好的答案说出来,这样就可以让interviwers知道你其实
也懂这方面的知识。


另一类问题是跟职位相关的,比如说这个职位的面临的最大挑战是啥,这个部门在整个公司起到的作用等等。问这类问题,是为了表现1. 你有备而来;2. 你对这个职位很感兴趣。


还有一些问题需要即席发挥,就interviewer的introduction的内容发问。这个没法准备,不过有个小窍门可以分享--很多时候,几个interviewer会有内容雷同的introduction。如果你反应不够快不能及时发掘出有意义的问题,可以留到
下一个interviewer再问。


总的来说,问问题的重要性不比答问题的低。而且还有一个窍门在里面--你问的问题多了,interviewer问你的时间自然就少了, then we can take the control and hide our language weakness... 当然要谨记的是,NO STUPID QUESTIONS !!



3. 抓住一切可以主动表现自己的机会,比如说self introduction和presentation。self intro就不细说了,任何一本面试的书都会介绍应该怎么组织。我觉得presentation需要两点,一要有趣味性,二是要全面。我当时onsite做的ppt尽量减少文字,多用图表,还准备了一个切题的暖场小笑话。至于内容,我一开始先介绍了我现在做的project的理论背景
和literature review,尽量简短,没有任何数学推导,只给出结论和reference。然后讨论了simulation和data analysis, 还详细说了一下我在sas中是怎么实现这个比较新的算法的。最后我还说了一下这个算法在credit risk modeling的应用和它的局限性。老板和同事们反应非常热烈,屡屡中途打断我问技术问题,原定半个小时超了半小时。(说到这里也得提一下我运气有多好--大老板在我介绍完理论部分后突然抚掌大笑,对HM说,这不就是你前几周琢磨的东西么?)



好了,俺也算知无不言言无不尽了,终于憋出了这篇总结。由于水平不高经验不多,对于统计和credit risk这个行业的认知都肯定挺幼稚,文中有错误还请大牛们指出,免得误导后来人。走过的路过的钱包还没空的,请给点包子。祝大家好运,都能找到自己心仪的工作。

D******n
发帖数: 2836
2
sofa~
你也来搞credit risk啊,什么公司?
我觉得有时候面试就是看个顺眼,所以自己觉得不错也有可能被刷。有时候,简历里面
无厘头一个关键字,就可以引起老板的注意。

个opening,马上投简历。两三个星
口不好挪窝,而且offer在我这鸟地
自于我拿到的offer,也有我对同类
risk modeling at banks). 面试需
outlier detection, missing value
model fitting 直至最后的model
cross-validation这些问题,一定会问,

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


A*******s
发帖数: 3942
3
在某银行干呢。
看顺眼很重要啊,俺有个师弟也是面了几个银行,结果他认为发挥的最差的一次拿了
offer,其他的都死的不明不白。。。

【在 D******n 的大作中提到】
: sofa~
: 你也来搞credit risk啊,什么公司?
: 我觉得有时候面试就是看个顺眼,所以自己觉得不错也有可能被刷。有时候,简历里面
: 无厘头一个关键字,就可以引起老板的注意。
:
: 个opening,马上投简历。两三个星
: 口不好挪窝,而且offer在我这鸟地
: 自于我拿到的offer,也有我对同类
: risk modeling at banks). 面试需
: outlier detection, missing value

D******n
发帖数: 2836
4
好像我们这些干credit risk就是银行,credit bureaus之间转了。

【在 A*******s 的大作中提到】
: 在某银行干呢。
: 看顺眼很重要啊,俺有个师弟也是面了几个银行,结果他认为发挥的最差的一次拿了
: offer,其他的都死的不明不白。。。

A*******s
发帖数: 3942
5
刚入行我也不懂,估计这行用不到啥高深的统计,也是跳不到别的行业去的原因之一吧。

【在 D******n 的大作中提到】
: 好像我们这些干credit risk就是银行,credit bureaus之间转了。
h******d
发帖数: 4
6
精算弟强人啊,不论是理论知识还是思想深度, 不服不行. 面试时能夹带个笑话还是需
要stong interpersonal skill的.

个opening,马上投简历。两三个星
interview。6月底onsite,onsite后
已经算很不错的了,没有讨价还价就
仅仅是来自于我拿到的offer,也有我对同类
risk modeling at banks). 面试需
transformation, outlier detection, missing value
model fitting 直至最后的model
cross-validation这些问题,一定会问,

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


l*********s
发帖数: 5409
7
同感

【在 h******d 的大作中提到】
: 精算弟强人啊,不论是理论知识还是思想深度, 不服不行. 面试时能夹带个笑话还是需
: 要stong interpersonal skill的.
:
: 个opening,马上投简历。两三个星
: interview。6月底onsite,onsite后
: 已经算很不错的了,没有讨价还价就
: 仅仅是来自于我拿到的offer,也有我对同类
: risk modeling at banks). 面试需
: transformation, outlier detection, missing value
: model fitting 直至最后的model

a****m
发帖数: 693
8
貌似大多数硕士毕业很难对上述概念做全面的了解,如lz那样的理解,很是佩服。
不知道 Actuaries 是怎么掌握理解这些东西,还有自己的体会,不过肯定准备充分。
w*****e
发帖数: 806
9
真的是牛人啊。。精算兄。。。无比佩服中。。

【在 h******d 的大作中提到】
: 精算弟强人啊,不论是理论知识还是思想深度, 不服不行. 面试时能夹带个笑话还是需
: 要stong interpersonal skill的.
:
: 个opening,马上投简历。两三个星
: interview。6月底onsite,onsite后
: 已经算很不错的了,没有讨价还价就
: 仅仅是来自于我拿到的offer,也有我对同类
: risk modeling at banks). 面试需
: transformation, outlier detection, missing value
: model fitting 直至最后的model

e****a
发帖数: 449
10
赞一个
相关主题
Principal Components Analysis 中 factor 选择的问题问大牛们一个logistic model的问题哈
求助:即将遭遇统计的第一个电话面试报面筋求实习合租 (转载)
感慨一下,学校的知识在实际工作中好苍白,求教两个困惑我许久的实际问题SVM和logistic regression 的比较
进入Statistics版参与讨论
A*******s
发帖数: 3942
11
我英语不行的。这种presentation的笑话可以事前准备,和interpersonal skill没啥
关系啊

【在 h******d 的大作中提到】
: 精算弟强人啊,不论是理论知识还是思想深度, 不服不行. 面试时能夹带个笑话还是需
: 要stong interpersonal skill的.
:
: 个opening,马上投简历。两三个星
: interview。6月底onsite,onsite后
: 已经算很不错的了,没有讨价还价就
: 仅仅是来自于我拿到的offer,也有我对同类
: risk modeling at banks). 面试需
: transformation, outlier detection, missing value
: model fitting 直至最后的model

A*******s
发帖数: 3942
12
这就是我灌水的收获了。可以说,我提到的问题在这版上以前都有相关的讨论,知道了
关键字再去搜搜论文,看一下
conclusion就行了,MS水平肯定够了。
所以说,找到工作的概率和灌水强度有significant positive correlation!

【在 a****m 的大作中提到】
: 貌似大多数硕士毕业很难对上述概念做全面的了解,如lz那样的理解,很是佩服。
: 不知道 Actuaries 是怎么掌握理解这些东西,还有自己的体会,不过肯定准备充分。

o****o
发帖数: 8077
13

很详细

个opening,马上投简历。两三个星
interview。6月底onsite,onsite后
已经算很不错的了,没有讨价还价就
仅仅是来自于我拿到的offer,也有我对同类
risk modeling at banks). 面试需
transformation, outlier detection, missing value
model fitting 直至最后的model
cross-validation这些问题,一定会问,

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


v********5
发帖数: 61
14
太牛了,很多提到的技术我都没听过。希望自己自学下能有所收获。
多谢精算兄!
i*******n
发帖数: 79
15
请问精算兄,你是怎么对non-statistician解释p-value和confidence interval的呢?我
被问过这俩问题,答的不好,急的我一脑袋汗...
谢谢!
A*******s
发帖数: 3942
16
p-value: the chance that your data support your null hypothesis.
CI: (wiki definition) we never know what the true value is. we can repeat
the experiments many times and have many different CIs. 95% of them would
encompass the true value.
another simpler way is: say the definition you know, followed by an real
world example.

【在 i*******n 的大作中提到】
: 请问精算兄,你是怎么对non-statistician解释p-value和confidence interval的呢?我
: 被问过这俩问题,答的不好,急的我一脑袋汗...
: 谢谢!

f****r
发帖数: 1140
17
精算兄真厉害。 相当有水平的总结!
广度深度,技术非技术都有了!

个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
讨价还价就接受了。

仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流
的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备
的技术问题TQ主要包括几方面:

transformation, outlier detection, missing valuerelated..., etc. 到
mulitcollinearity detection, variable/model selection, model fitting 直至最
后的model validation & model diagnostics...像multicollinearity, model
selection, cross-validation这些问题,一定会问,屡试不爽。

risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出
,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和
behaviral modeling。一般来说,需要的data mining methods会在job requirement里
说清楚。这个没啥好说的,太多细节了,自己掌握吧。

proc。

。要把简历上的东西和衍生的所有细节都倒背如流。

. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model
inferences等等。

sigma, econometrics, optimization... 还是得看job requirements.



至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时
候听。
,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么
就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to
outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,
不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:&#
8232;

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


d******e
发帖数: 7844
18
stepwise还有一个缺点,就是p>>n的情况下很有可能是ill-posed,不过貌似credit
risk modelling没什么high dimensional的问题

个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
头offer。考虑到拖家带
一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试
的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling
at banks). 面试需要准备的技术问题TQ主要包括几方面
transformation, outlier detection, missing valuerelated..., etc. 到
mulitcollinearity detection, variable/model selection, model fitting 直至最
后的model validation & model diagnostics..
出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的
model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于
credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要
proc。

。要把简历上的东西和衍生的所有细节都倒背如流。

. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model
inferences等等。

sigma, econometrics, optimization... 还是得看job requirements.



至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时
候听。
,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么
就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to
outperform other candidates; 2. in

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


i*******n
发帖数: 79
19

谢谢精算兄!
有关p-value,我琢磨了许久想到这么说:Given your null hypothesis is true, the
probability of
rejecting it based on your data.不过还是没有你的这个说法简洁易懂.万分感谢!

【在 A*******s 的大作中提到】
: p-value: the chance that your data support your null hypothesis.
: CI: (wiki definition) we never know what the true value is. we can repeat
: the experiments many times and have many different CIs. 95% of them would
: encompass the true value.
: another simpler way is: say the definition you know, followed by an real
: world example.

D******n
发帖数: 2836
20
不多,就几百到上千吧。

modeling


【在 d******e 的大作中提到】
: stepwise还有一个缺点,就是p>>n的情况下很有可能是ill-posed,不过貌似credit
: risk modelling没什么high dimensional的问题
:
: 个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
: 来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
: 头offer。考虑到拖家带
: 一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试
: 的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling
: at banks). 面试需要准备的技术问题TQ主要包括几方面
: transformation, outlier detection, missing valuerelated..., etc. 到

相关主题
T家面试题目求解答~~抓狂!为啥选出来的predictor都这么差
关于stepwise programming请问:想fit gamma 并同时用lasso的方法做variable selection
电话面试完了,肯定没戏,大家帮我看看题目,就算学习吧关于lasso的variable selection问题
进入Statistics版参与讨论
A*******s
发帖数: 3942
21
good to know. that's what i said--learning from watering

modeling

【在 d******e 的大作中提到】
: stepwise还有一个缺点,就是p>>n的情况下很有可能是ill-posed,不过貌似credit
: risk modelling没什么high dimensional的问题
:
: 个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
: 来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
: 头offer。考虑到拖家带
: 一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试
: 的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling
: at banks). 面试需要准备的技术问题TQ主要包括几方面
: transformation, outlier detection, missing valuerelated..., etc. 到

D******n
发帖数: 2836
22
chance of seeing such an extreme statistic or worse given ur hypothesis is
correct.

【在 i*******n 的大作中提到】
:
: 谢谢精算兄!
: 有关p-value,我琢磨了许久想到这么说:Given your null hypothesis is true, the
: probability of
: rejecting it based on your data.不过还是没有你的这个说法简洁易懂.万分感谢!

D******n
发帖数: 2836
23
hehe,说笑话就怕大家都不笑。。。lol

【在 A*******s 的大作中提到】
: 我英语不行的。这种presentation的笑话可以事前准备,和interpersonal skill没啥
: 关系啊

s*******a
发帖数: 213
24
Mark!
h******d
发帖数: 4
25
是的。个人认为面试时讲笑话是看本事的。 如果现场很紧张,一个笑话可能显得很突
兀,当然也可能打破僵局;如果大家都聊的很有状态,肯定笑话就是锦上添花的了。精
算兄的笑话有positive的效果,说明现场控制的不错。
再赞精算兄“知无不言言无不尽“。

【在 D******n 的大作中提到】
: hehe,说笑话就怕大家都不笑。。。lol
l********n
发帖数: 267
26
不得不mark一下啊
s**********l
发帖数: 395
27
受益匪浅,谢谢。
s******9
发帖数: 12
28
看了你的帖子学到很多东西,谢谢.
c*****g
发帖数: 40
29
Nice summary. Why your nick name is Actuaries, BTW?
S*******n
发帖数: 40
30
mark
相关主题
Gene expression =?= Variable selectiongood classification methods for high dimension data
用LASSO选变量后重新fit regression有什么弊端?model的predictors之间有multi-colinearity怎么办?
data science 面试求教【大包子】Factor data analysis
进入Statistics版参与讨论
w**********y
发帖数: 1691
31
赞一个.
master毕业能把1,2解释清楚,很不错,很牛
SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
Rregression更好
个人觉得,这个取决于classification是不是linear的. 如果P很大,而且主要是linear
的,logistic regression + L2/L1 penalty 有可能比SVM好;Hastie那篇经典论文给了
一些例子
如果是curve的,那么kernel SVM可能会更好;
Boosting不能算一种方法,而是一个概念,就像bagging这个概念一样.最传统可能的
AdaBoosting,印象中就是一层的tree然后boost..我知道一些保险公司用decision tree
,因为他们需要把一些continuous variable转换成categorical的.
而现在的data mining的趋势(我了解的几个比赛结果),往往要几个model的weighted
summary 结果才能最好.而且传统的不一定比popular的差(去年有个比赛,ANN赢了第一)
最近参加一个比赛,得到的一个非常重要的经验是,对data的研究和适当改造/优化,跟做
model至少同等重要..
最后还是说一声,恭喜!牛!
w*********8
发帖数: 70
32
very good summary!!
d*******o
发帖数: 493
33
精算兄太牛了,顶一个
d*******o
发帖数: 493
34
请问牛人,在银行做personal risk(credit scoring)方向的能转到做financial risk(
VaR, Market risk,portfolio management)方向吗?谢谢。

linear
tree

【在 w**********y 的大作中提到】
: 赞一个.
: master毕业能把1,2解释清楚,很不错,很牛
: SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
: Rregression更好
: 个人觉得,这个取决于classification是不是linear的. 如果P很大,而且主要是linear
: 的,logistic regression + L2/L1 penalty 有可能比SVM好;Hastie那篇经典论文给了
: 一些例子
: 如果是curve的,那么kernel SVM可能会更好;
: Boosting不能算一种方法,而是一个概念,就像bagging这个概念一样.最传统可能的
: AdaBoosting,印象中就是一层的tree然后boost..我知道一些保险公司用decision tree

z**k
发帖数: 378
35
顶,好帖啊

个opening,
马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


Z*******n
发帖数: 694
36
赞一个!

linear
tree

【在 w**********y 的大作中提到】
: 赞一个.
: master毕业能把1,2解释清楚,很不错,很牛
: SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
: Rregression更好
: 个人觉得,这个取决于classification是不是linear的. 如果P很大,而且主要是linear
: 的,logistic regression + L2/L1 penalty 有可能比SVM好;Hastie那篇经典论文给了
: 一些例子
: 如果是curve的,那么kernel SVM可能会更好;
: Boosting不能算一种方法,而是一个概念,就像bagging这个概念一样.最传统可能的
: AdaBoosting,印象中就是一层的tree然后boost..我知道一些保险公司用decision tree

g*********n
发帖数: 441
37
这个写的不错……

linear
tree

【在 w**********y 的大作中提到】
: 赞一个.
: master毕业能把1,2解释清楚,很不错,很牛
: SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
: Rregression更好
: 个人觉得,这个取决于classification是不是linear的. 如果P很大,而且主要是linear
: 的,logistic regression + L2/L1 penalty 有可能比SVM好;Hastie那篇经典论文给了
: 一些例子
: 如果是curve的,那么kernel SVM可能会更好;
: Boosting不能算一种方法,而是一个概念,就像bagging这个概念一样.最传统可能的
: AdaBoosting,印象中就是一层的tree然后boost..我知道一些保险公司用decision tree

c****o
发帖数: 69
38
顶一下
l**********9
发帖数: 148
39
cong!
It is updated at last!
l***a
发帖数: 12410
40
yes, sometimes you do need to deal with such kind of data, especially when
building forecast model

offer,也有我对同类型opening面试
modeling

【在 d******e 的大作中提到】
: stepwise还有一个缺点,就是p>>n的情况下很有可能是ill-posed,不过貌似credit
: risk modelling没什么high dimensional的问题
:
: 个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
: 来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
: 头offer。考虑到拖家带
: 一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试
: 的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling
: at banks). 面试需要准备的技术问题TQ主要包括几方面
: transformation, outlier detection, missing valuerelated..., etc. 到

相关主题
【大包子】Factor data analysis求助:即将遭遇统计的第一个电话面试
logistic regression结果释疑,解读感慨一下,学校的知识在实际工作中好苍白,求教两个困惑我许久的实际问题
Principal Components Analysis 中 factor 选择的问题问大牛们一个logistic model的问题哈
进入Statistics版参与讨论
p********a
发帖数: 5352
41
奖励20个包子,谢谢分享经验
A*******s
发帖数: 3942
42
赞大牛现身
其实我只是把我遇到的和我听到过的面试题的全集写出来而已,我的水平还远远不到理
解任何一方面的地步。碰到问的深一点的就马上歇菜...
有几个问题问大牛,
1. hastie那篇经典的文章指的是?我倒是粗略地过了一遍他写的ESL,但是对有没有讨
论过这个问题没啥印象了。
2. “我知道一些保险公司用decision tree,因为他们需要把一些continuous variable
转换成categorical的.”这么做的目的是啥?market segmentation?
3. 有什么算法公开的比较有名的data mining competition可以围观一下么?
4. 请推荐review paper about“对data的研究和适当改造/优化”。我倒是搜到一本书
,不知道怎么样?
http://www.temida.si/~bojan/MPS/materials/Data_preparation_for_data_mining.pdf

linear
tree

【在 w**********y 的大作中提到】
: 赞一个.
: master毕业能把1,2解释清楚,很不错,很牛
: SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
: Rregression更好
: 个人觉得,这个取决于classification是不是linear的. 如果P很大,而且主要是linear
: 的,logistic regression + L2/L1 penalty 有可能比SVM好;Hastie那篇经典论文给了
: 一些例子
: 如果是curve的,那么kernel SVM可能会更好;
: Boosting不能算一种方法,而是一个概念,就像bagging这个概念一样.最传统可能的
: AdaBoosting,印象中就是一层的tree然后boost..我知道一些保险公司用decision tree

L*****p
发帖数: 272
43
thanks for sharing
good post
w**********y
发帖数: 1691
44
@Actuaries:
俺可不是啥大牛,一phd学生而已.
1. Hastie那篇经典的文章指的是?我倒是粗略地过了一遍他写的ESL,但是对有没有讨
论过这个问题没啥印象了。
我忘记当初我是看的哪篇文章了.但是可以给两篇参考:
http://www-stat.stanford.edu/~hastie/Papers/SVM_SS_disc.pdf
最后面有讨论和参考文献;
http://www-stat.stanford.edu/~hastie/Papers/svmtalk.pdf
这个talk很直观简单
ESL那一章写的很好,读着感觉很爽..ridge regression,PCR, LASSO, PLS,bestsubset
被他总结到一起,分析相互的关系和区别..建议好好读
2. “我知道一些保险公司用decision tree,因为他们需要把一些continuous variable
转换成categorical的.”这么做的目的是啥?market segmentation?
这个大概两年前我发帖讨论过一次.我在一个保险公司做intern,一开始很疑惑他们
大部分的variable都要变成categorical的.后来发现有三个主要原因:
1.他们的的model既需要关注prediction,还希望保证explainable. 特别是你需要
跟那些精算师meet,保证能让他们也觉得有道理..而一个基本的要求,就是大部分
情况,期望x跟y是monotonic的关系;只要转换成categorical的才可能达到这个要求
2.直观的理解,比如Y是车保险的loss ratio, x是年龄, 26岁和27岁的不应该有什么差
别.
所以分成homogeneous的几个groups,比直接用continuous variable更make sense
3.保险公司的数据一般都足够大,所以他们在model之外有很多data driven的讨论.他们
很多variable如何选择,如何categorize,都是统计的人和精算的共同讨论的结果
3. 有什么算法公开的比较有名的data mining competition可以围观一下么?
1.最有名的当然是Netflix Prize了.wiki之.. 参考文献的16,17是他们08年的model
2.KDD cup也是比较有名的比赛;
3.我说的ANN拿第一名的是一个medical领域的比赛:
PhysioNet/Computers in Cardiology Challenge 2009:
4.我这个月参加的一个比赛: 2010 INFORMS data mining contest
5.Kaggle.com上面一直有各种比赛,而且blog上面会有’获奖感言’
4. 请推荐review paper about“对data的研究和适当改造/优化”。我倒是搜到一本书
,不知道怎么样?
http://www.temida.si/~bojan/MPS/materials/Data_preparation_for_data_mining.pdf
谢谢你的这个书,我回头去看看.
我其实没看过系统的介绍.其实还是这次INFORMS的比赛,得到的一些经验教训.
这个比赛是让你预测股票1个小时之后的涨跌:
1.数据中有很多data有异常,特别是下午3点之后.为什么呢?3点的1个小时之后
是第二天了.这一晚上会发生很多事情,所以很多data的x和y的correlation都发生
了很多的变化..我就完全忽视了这部分data;
而一个比较有经验的data miner,是非常慎重的用第一遍fit的model很细心的check哪部
分datafit的好,那部分不好,以及发生的原因
2.另外一个参赛者,注意到了stock变化的heavy tail,所以无论他做svm还是logistic
reg都不是直接使用x,而是使用x的一种quantile的变化.这种变化未必是最好的,但是,
也足够反映了对data pre-study的重要性
看我码这么多字的份下,等俺找不到工作时,帮我内部refer一下,呵呵
l***a
发帖数: 12410
45
mark

bestsubset
variable

【在 w**********y 的大作中提到】
: @Actuaries:
: 俺可不是啥大牛,一phd学生而已.
: 1. Hastie那篇经典的文章指的是?我倒是粗略地过了一遍他写的ESL,但是对有没有讨
: 论过这个问题没啥印象了。
: 我忘记当初我是看的哪篇文章了.但是可以给两篇参考:
: http://www-stat.stanford.edu/~hastie/Papers/SVM_SS_disc.pdf
: 最后面有讨论和参考文献;
: http://www-stat.stanford.edu/~hastie/Papers/svmtalk.pdf
: 这个talk很直观简单
: ESL那一章写的很好,读着感觉很爽..ridge regression,PCR, LASSO, PLS,bestsubset

p********a
发帖数: 5352
46
COW。。。都是COW MAN
D******n
发帖数: 2836
47
Did u participate in the UCSD datamining competition?

bestsubset

【在 w**********y 的大作中提到】
: @Actuaries:
: 俺可不是啥大牛,一phd学生而已.
: 1. Hastie那篇经典的文章指的是?我倒是粗略地过了一遍他写的ESL,但是对有没有讨
: 论过这个问题没啥印象了。
: 我忘记当初我是看的哪篇文章了.但是可以给两篇参考:
: http://www-stat.stanford.edu/~hastie/Papers/SVM_SS_disc.pdf
: 最后面有讨论和参考文献;
: http://www-stat.stanford.edu/~hastie/Papers/svmtalk.pdf
: 这个talk很直观简单
: ESL那一章写的很好,读着感觉很爽..ridge regression,PCR, LASSO, PLS,bestsubset

l**********9
发帖数: 148
48
赞,这贴为啥还不置顶?
A*******s
发帖数: 3942
49
1. 深有同感。ESL那章虽然有些我看不明白,但是光记住结论就可以蒙住大部分HM了,
可能他们对硕士要求不高吧。
2. 看来保险和银行有点类似,有时候interpretation甚至要比prediction更重要。
欢迎大牛来找我refer,referral fee有500刀,哈!8g一下,据说wells fargo的
referral fee有5000刀!可惜WF现在不招外国人,要不俺马上跳过去,专门负责refer
板上兄弟,哈!

bestsubset

【在 w**********y 的大作中提到】
: @Actuaries:
: 俺可不是啥大牛,一phd学生而已.
: 1. Hastie那篇经典的文章指的是?我倒是粗略地过了一遍他写的ESL,但是对有没有讨
: 论过这个问题没啥印象了。
: 我忘记当初我是看的哪篇文章了.但是可以给两篇参考:
: http://www-stat.stanford.edu/~hastie/Papers/SVM_SS_disc.pdf
: 最后面有讨论和参考文献;
: http://www-stat.stanford.edu/~hastie/Papers/svmtalk.pdf
: 这个talk很直观简单
: ESL那一章写的很好,读着感觉很爽..ridge regression,PCR, LASSO, PLS,bestsubset

s*********e
发帖数: 944
50
thanks very much!
相关主题
报面筋求实习合租 (转载)关于stepwise programming
SVM和logistic regression 的比较电话面试完了,肯定没戏,大家帮我看看题目,就算学习吧
T家面试题目求解答~~抓狂!为啥选出来的predictor都这么差
进入Statistics版参与讨论
m**********4
发帖数: 774
51
I came to this post because my friend recommended me to take a look. I think
Lou zhu is a truly smart and determined person. I think this post will
benefit many people in the future.
Just a quick question: Ridge regression is a technique for variable
selection? I know it is a shrinkage method, but it does not zero out
anything, seems to me. I remember reading it somewhere that in the bias-
variance tradeoff, it somehow reduces the variance.
Also, seems to me PCA is dimension reduction but not variable selection.
Please correct me if I am not right.

个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
讨价还价就接受了。

仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流
的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备
的技术问题TQ主要包括几方面:

transformation, outlier detection, missing valuerelated..., etc. 到
mulitcollinearity detection, variable/model selection, model fitting 直至最
后的model validation & model diagnostics...像multicollinearity, model
selection, cross-validation这些问题,一定会问,屡试不爽。

risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出
,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和
behaviral modeling。一般来说,需要的data mining methods会在job requirement里
说清楚。这个没啥好说的,太多细节了,自己掌握吧。

proc。

。要把简历上的东西和衍生的所有细节都倒背如流。

. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model
inferences等等。

sigma, econometrics, optimization... 还是得看job requirements.



至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时
候听。
,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么
就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to
outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,
不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:&#
8232;

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


l*********s
发帖数: 5409
52
ridge regression, imhpw, is a facilitating method, reducing of variance
allows you to say something about effectors in cases of high-
dimension/high multicolinearity.
PCA can achieve variable reduction/selection, but you have to live up
with the new set of compositive regressors.

think
will
bias-
selection.

【在 m**********4 的大作中提到】
: I came to this post because my friend recommended me to take a look. I think
: Lou zhu is a truly smart and determined person. I think this post will
: benefit many people in the future.
: Just a quick question: Ridge regression is a technique for variable
: selection? I know it is a shrinkage method, but it does not zero out
: anything, seems to me. I remember reading it somewhere that in the bias-
: variance tradeoff, it somehow reduces the variance.
: Also, seems to me PCA is dimension reduction but not variable selection.
: Please correct me if I am not right.
:

f*****a
发帖数: 693
53
Mark, thanks for sharing.

个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
讨价还价就接受了。

仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流
的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备
的技术问题TQ主要包括几方面:

transformation, outlier detection, missing valuerelated..., etc. 到
mulitcollinearity detection, variable/model selection, model fitting 直至最
后的model validation & model diagnostics...像multicollinearity, model
selection, cross-validation这些问题,一定会问,屡试不爽。

risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出
,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和
behaviral modeling。一般来说,需要的data mining methods会在job requirement里
说清楚。这个没啥好说的,太多细节了,自己掌握吧。

proc。

。要把简历上的东西和衍生的所有细节都倒背如流。

. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model
inferences等等。

sigma, econometrics, optimization... 还是得看job requirements.



至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时
候听。
,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么
就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to
outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,
不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:&#
8232;

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


s****o
发帖数: 9
54
Thanks! Very useful!!
p********i
发帖数: 1963
55
不错不错不错..

个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
讨价还价就接受了。

仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流
的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备
的技术问题TQ主要包括几方面:

transformation, outlier detection, missing valuerelated..., etc. 到
mulitcollinearity detection, variable/model selection, model fitting 直至最
后的model validation & model diagnostics...像multicollinearity, model
selection, cross-validation这些问题,一定会问,屡试不爽。

risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出
,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和
behaviral modeling。一般来说,需要的data mining methods会在job requirement里
说清楚。这个没啥好说的,太多细节了,自己掌握吧。

proc。

。要把简历上的东西和衍生的所有细节都倒背如流。

. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model
inferences等等。

sigma, econometrics, optimization... 还是得看job requirements.



至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时
候听。
,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么
就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to
outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,
不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:&#
8232;

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


n*********0
发帖数: 31
56
lz,谢谢分享,lz好牛!我也听说有些公司refer费挺高的。
p**********l
发帖数: 1160
57
Actuaries 是一个的确 很牛的同学。真的很pf。
x********u
发帖数: 64
58
niu
z*********o
发帖数: 541
59
mark
v*********0
发帖数: 941
60
Thanks!!
相关主题
请问:想fit gamma 并同时用lasso的方法做variable selection用LASSO选变量后重新fit regression有什么弊端?
关于lasso的variable selection问题data science 面试求教
Gene expression =?= Variable selectiongood classification methods for high dimension data
进入Statistics版参与讨论
c****t
发帖数: 19049
61
给你泼点水。你这总结本来是outstanding的,可惜最后的部分掉了。主动show off
technical的东西也没啥,但其实掌握起来比说笑话还难。那个HM可够nice的,还给你
解释。换个主没准就踹了你了。大家都知道你love c。 实际上面试时b往往可能是更好
的回答。你这c跟你被换credit部门那次的经历没啥区别。只不过这次你运气好,HM没
找茬。
A*******s
发帖数: 3942
62
what r u referring to?

【在 c****t 的大作中提到】
: 给你泼点水。你这总结本来是outstanding的,可惜最后的部分掉了。主动show off
: technical的东西也没啥,但其实掌握起来比说笑话还难。那个HM可够nice的,还给你
: 解释。换个主没准就踹了你了。大家都知道你love c。 实际上面试时b往往可能是更好
: 的回答。你这c跟你被换credit部门那次的经历没啥区别。只不过这次你运气好,HM没
: 找茬。

v*******a
发帖数: 1193
63
楼主现在已经开始工作了吧?希望楼主继续把工作中的经验和大家分享,对我这种想进
这行的人会很有帮助。谢谢。
我想问下,1)credit risk analysis的logistic regression主要outcome是什么?
2)在model中一般应该考虑的variable有哪些?
3)做这行的是不是很多人考FRM?
谢谢

个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
讨价还价就接受了。

仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流
的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备
的技术问题TQ主要包括几方面:

transformation, outlier detection, missing valuerelated..., etc. 到
mulitcollinearity detection, variable/model selection, model fitting 直至最
后的model validation & model diagnostics...像multicollinearity, model
selection, cross-validation这些问题,一定会问,屡试不爽。

risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出
,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和
behaviral modeling。一般来说,需要的data mining methods会在job requirement里
说清楚。这个没啥好说的,太多细节了,自己掌握吧。

proc。

。要把简历上的东西和衍生的所有细节都倒背如流。

. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model
inferences等等。

sigma, econometrics, optimization... 还是得看job requirements.



至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时
候听。
,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么
就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to
outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,
不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:&#
8232;

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


v*******a
发帖数: 1193
64
fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法
,对于credit scoring data来说表现并不比Logistic Rregression更好)。
请问这个paper是哪个?我想来研读一下。
what is SVM ?

个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
讨价还价就接受了。

仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流
的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备
的技术问题TQ主要包括几方面:

transformation, outlier detection, missing valuerelated..., etc. 到
mulitcollinearity detection, variable/model selection, model fitting 直至最
后的model validation & model diagnostics...像multicollinearity, model
selection, cross-validation这些问题,一定会问,屡试不爽。

risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出
,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic
Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和
behaviral modeling。一般来说,需要的data mining methods会在job requirement里
说清楚。这个没啥好说的,太多细节了,自己掌握吧。

proc。

。要把简历上的东西和衍生的所有细节都倒背如流。

. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model
inferences等等。

sigma, econometrics, optimization... 还是得看job requirements.



至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时
候听。
,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么
就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to
outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,
不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:&#
8232;

【在 A*******s 的大作中提到】
: 先说说拿到这个offer的一些过程。一直盯着几间大银行的网站,五月初发现local有个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有讨价还价就接受了。

: 
言归正题,接下来写写我觉得值得和大家分享的一些面试经验。这些经验不仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流的一些经验(主要是statisticians/credit risk modeling at banks). 面试需要准备的技术问题TQ主要包括几方面:

: 
1. GLM. 这个包括了整个过程,从一开始的data cleaning and transformation, outlier detection, missing valuerelated..., etc. 到mulitcollinearity detection, variable/model selection, model fitting 直至最后的model validation & model diagnostics...像multicollinearity, model selection, cross-validation这些问题,一定会问,屡试不爽。

: 
2. data mining。需要指出的是,由于regulation的限制,GLM是credit risk modeling的主流方法,fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法,对于credit scoring data来说表现并不比Logistic Rregression更好)。但也有银行要求有data mining的技术,一般用于marketing和behaviral modeling。一般来说,需要的data mining methods会在job requirement里说清楚。这个没啥好说的,太多细节了,自己掌握吧。

: 
3. SAS. 主要是data step, proc sql, macro. 以及上面说的1和2相对应的proc。

: 
4. 简历相关的一切技术问题。像我在招工上篇说的,这个答不好是诚信问题。要把简历上的东西和衍生的所有细节都倒背如流。

: 
5. 统计的基本概念,以及如何communicate with non-technical audiences. 比如说,要如何不用任何统计术语来解释p-value, confidence interval, model inferences等等。

: 
6. 其他一些零散的统计和数学知识,比如说experimental design, six sigma, econometrics, optimization... 还是得看job requirements.


至于行为问题BQ,大家还是找本书看看吧。我看的是这本,买了cd在开车的时候听。
: http://www.amazon.com/101-Dynamite-Answers-Interview-Questions/dp/1570230781

;
: 
我觉得准备好了上述的问题,面试的时候就可以兵来将挡水来土掩了。可是,我曾经有这样的疑惑,也有朋友问我相同的问题--所以的TQ/BQ都答出来了,为什么就是没有offer?后来我想明白了--1. 答得对不等于答得最好,you need to outperform other candidates; 2. interviewer不会问得面面俱到,与其守株待兔,不如反客为主展示自己的实力。
 所以,我觉得有几个面试的技巧需要注意:


R*****g
发帖数: 99
65
受益匪浅。深受各种各样的启发:)
不过,是楼主有性别歧视还是这一行有性别偏向么?只refer兄弟?

refer

【在 A*******s 的大作中提到】
: 1. 深有同感。ESL那章虽然有些我看不明白,但是光记住结论就可以蒙住大部分HM了,
: 可能他们对硕士要求不高吧。
: 2. 看来保险和银行有点类似,有时候interpretation甚至要比prediction更重要。
: 欢迎大牛来找我refer,referral fee有500刀,哈!8g一下,据说wells fargo的
: referral fee有5000刀!可惜WF现在不招外国人,要不俺马上跳过去,专门负责refer
: 板上兄弟,哈!
:
: bestsubset

A*******s
发帖数: 3942
66

算出不还钱的概率,把customer按优先次序借钱/追债
挺多的,比如说最相关的就是credit bureau score, 有的小银行没钱搞自己的model,
干脆就直接买这个用。其他的有loan/asset ratio, 还有根据credit history搞出来的
一些变量
不多。我linkedin 上看了几十号人也就一俩个有。我看了一下FRM,这个还是很全面的
一个考试。credit risk只是其中一部分,consumer credit risk又是其中的更小一部
分。对找工作没啥用的,可能对跳槽有用。

【在 v*******a 的大作中提到】
: 楼主现在已经开始工作了吧?希望楼主继续把工作中的经验和大家分享,对我这种想进
: 这行的人会很有帮助。谢谢。
: 我想问下,1)credit risk analysis的logistic regression主要outcome是什么?
: 2)在model中一般应该考虑的variable有哪些?
: 3)做这行的是不是很多人考FRM?
: 谢谢
:
: 个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
: 来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
: 头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有

A*******s
发帖数: 3942
67
generally speaking, N is very very large, making the prediction task easier.
And regulation requires transparency and easy interpretation of modeling.

【在 v*******a 的大作中提到】
: fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法
: ,对于credit scoring data来说表现并不比Logistic Rregression更好)。
: 请问这个paper是哪个?我想来研读一下。
: what is SVM ?
:
: 个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
: 来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
: 头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
: 讨价还价就接受了。

: 仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流

n*********y
发帖数: 474
68
Support vector machine

【在 v*******a 的大作中提到】
: fancy的model一般来说没啥用武之地(实际上也有论文指出,SVM和boosting之类的方法
: ,对于credit scoring data来说表现并不比Logistic Rregression更好)。
: 请问这个paper是哪个?我想来研读一下。
: what is SVM ?
:
: 个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
: 来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
: 头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有
: 讨价还价就接受了。

: 仅仅是来自于我拿到的offer,也有我对同类型opening面试的一些总结,和与朋友交流

n*********y
发帖数: 474
69
logistic regression在account level时候用得比较多,比如说pull出所有开卡6-12个
月新
帐户,决定给那些帐户涨credit limit等等。到了portfolio level更多的是time
series和
economics stress overlay
至于variables,accounts level很多很多了,个人信息,payment信息,到了
portfolio
level就是各个deliquency buckets的units and dollars。取决于project要做些什么,
collections, finance和marketing涉及的variables完全不一样。
至于FRM神马的都是浮云,什么样背景的都有,fancy model都没用,绝大多数的model
早已set
up很久了,抓住那些稀有的modeling机会,让大家follow你的methodology,自然大家
依赖你,
你也就更多升职的机会。大银行还是比较论资排辈的,薪水不好不坏,不过还是比较稳
定的,以后怎
么发展什么的都看自己了。

【在 v*******a 的大作中提到】
: 楼主现在已经开始工作了吧?希望楼主继续把工作中的经验和大家分享,对我这种想进
: 这行的人会很有帮助。谢谢。
: 我想问下,1)credit risk analysis的logistic regression主要outcome是什么?
: 2)在model中一般应该考虑的variable有哪些?
: 3)做这行的是不是很多人考FRM?
: 谢谢
:
: 个opening,马上投简历。两三个星期之后HR做了phone screen, 几天之后和HM还有未
: 来的一个同事进行了phone interview。6月底onsite,onsite后半个小时电话通知了口
: 头offer。考虑到拖家带口不好挪窝,而且offer在我这鸟地方已经算很不错的了,没有

w**********n
发帖数: 29
70
赞一个!期待楼主把工作心得,和对广大找工作的MS的建议持续更新。
1 (共1页)
进入Statistics版参与讨论
相关主题
请问:想fit gamma 并同时用lasso的方法做variable selectionlogistic regression结果释疑,解读
关于lasso的variable selection问题Principal Components Analysis 中 factor 选择的问题
Gene expression =?= Variable selection求助:即将遭遇统计的第一个电话面试
用LASSO选变量后重新fit regression有什么弊端?感慨一下,学校的知识在实际工作中好苍白,求教两个困惑我许久的实际问题
data science 面试求教问大牛们一个logistic model的问题哈
good classification methods for high dimension data报面筋求实习合租 (转载)
model的predictors之间有multi-colinearity怎么办?SVM和logistic regression 的比较
【大包子】Factor data analysisT家面试题目求解答~~
相关话题的讨论汇总
话题: 8232话题: model话题: data话题: modeling话题: 问题