由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - model validation 工作前景如何?
相关主题
offer请教问一个 classification 的问题
一个combine scored models的问题LOGISTIC REGRESSION需要DATA正态分布么?
credit risk scorecard一般是指retail credit risk吗?统计在保险业(Casualty & Property) 中的应用以及发展
请教model validation方面的面试can SAS implement L1 Regularized Logistic Regression?
大家是对统计真得感兴趣还是只为了混口饭吃?找工作总结 [下]
credit risk的大牛们,科普一下Credit Risk Parameters 吧!请教 这个GLM问题如何回答
Ms学校选择:NCSU stat 和Harvard Biostat有谁对 Finite Mixture Model 比较了解的吗?
我工作中的致命弱点,求真心指教!! (转载)What models bank and credit cards companies use?
相关话题的讨论汇总
话题: model话题: validation话题: data话题: 银行话题: bank
进入Statistics版参与讨论
1 (共1页)
f*******n
发帖数: 2665
1
现在银行好像很重视这一块,但不知道是不是适合长期做的工作?
s*********e
发帖数: 1051
2
你自己喜欢吗?
f*******n
发帖数: 2665
3
如果能接触到各种不同的model因该是挺有意思的,但银行的model在技术上很单一,可
能主要是因为compliance上的限制。

【在 s*********e 的大作中提到】
: 你自己喜欢吗?
s*********e
发帖数: 1051
4
"银行的model在技术上很单一"
- this is not true.
f*******n
发帖数: 2665
5
我是指credit risk model, 好像只有logistic regression,当然银行还有其他种类
的model。

【在 s*********e 的大作中提到】
: "银行的model在技术上很单一"
: - this is not true.

A*******s
发帖数: 3942
6
model validation应该会涵盖银行的所有model
作为一个在risk和aml呆过的model developer来说,
除了你说的logistic regression之外,
我搞过的东西有--
model and simulate panel data with temporal and spatial correlation;
competing risk Cox model;
various forecasting models with exogenous variable;
GLM & Double GLM;
Copula;
retrospective case-control matching;
likelihood based missing data analysis;
text clustering and classification
所以说银行的model没你想的那么单调,
不过这完全取决于老板是不是在乎模型是否严格....
如果不在乎的话,
银行里面有一大堆聪明人(可惜不懂数学和统计)搞出来的quick & dirty的方法
保证让科班出身的人看了哭笑不得
再说,银行还有很大一块是marketing model
个人还没接触过,这里面的应用按理应该更丰富一些。

【在 f*******n 的大作中提到】
: 我是指credit risk model, 好像只有logistic regression,当然银行还有其他种类
: 的model。

s*********e
发帖数: 1051
7
check Merton model

【在 f*******n 的大作中提到】
: 我是指credit risk model, 好像只有logistic regression,当然银行还有其他种类
: 的model。

s******s
发帖数: 2837
8
mark

【在 A*******s 的大作中提到】
: model validation应该会涵盖银行的所有model
: 作为一个在risk和aml呆过的model developer来说,
: 除了你说的logistic regression之外,
: 我搞过的东西有--
: model and simulate panel data with temporal and spatial correlation;
: competing risk Cox model;
: various forecasting models with exogenous variable;
: GLM & Double GLM;
: Copula;
: retrospective case-control matching;

s*********h
发帖数: 6288
9
这些东西还是很单调……
主要还是很多东西必须在BASEL框架里面。很难用现代的machine learning去做。

【在 A*******s 的大作中提到】
: model validation应该会涵盖银行的所有model
: 作为一个在risk和aml呆过的model developer来说,
: 除了你说的logistic regression之外,
: 我搞过的东西有--
: model and simulate panel data with temporal and spatial correlation;
: competing risk Cox model;
: various forecasting models with exogenous variable;
: GLM & Double GLM;
: Copula;
: retrospective case-control matching;

A*******s
发帖数: 3942
10
业界里的machine learning
99%都是直接扔Y和X进去了事
现在热的data science,
难点也大多不在machine learning上面
况且machine learning也不是万能的,
要真搞causal inference,experimental design,longitudinal data,missing data
,survival analysis,sampling design这类东西还是得靠传统的statistics,
econometrics也有很多可学的东西

【在 s*********h 的大作中提到】
: 这些东西还是很单调……
: 主要还是很多东西必须在BASEL框架里面。很难用现代的machine learning去做。

相关主题
credit risk的大牛们,科普一下Credit Risk Parameters 吧!问一个 classification 的问题
Ms学校选择:NCSU stat 和Harvard BiostatLOGISTIC REGRESSION需要DATA正态分布么?
我工作中的致命弱点,求真心指教!! (转载)统计在保险业(Casualty & Property) 中的应用以及发展
进入Statistics版参与讨论
D******n
发帖数: 2836
11
一大堆懂数学和统计的聪明人(可惜不懂数据和编程)搞出来的solution(mainly SAS
code)也常常让人一声叹息。
D******n
发帖数: 2836
12
just means to an end, 不一定machine learning才更“高级”,也不是复杂的统计模
型比简单的logistic regression 管用。

【在 s*********h 的大作中提到】
: 这些东西还是很单调……
: 主要还是很多东西必须在BASEL框架里面。很难用现代的machine learning去做。

A*******s
发帖数: 3942
13
银行里数据还是比较简单吧,
而且也没什么必须要用online algorithm的场合
solution只要能在一天内跑完就没人care啊

SAS

【在 D******n 的大作中提到】
: 一大堆懂数学和统计的聪明人(可惜不懂数据和编程)搞出来的solution(mainly SAS
: code)也常常让人一声叹息。

D******n
发帖数: 2836
14
搞清楚之后,应该不复杂,问题大概没有谁比较清楚。
而且code efficiency的影响是多层次的。
一般可能就是觉得快了,或者只快一点。但这只是最直接的影响。一个好的code 不一
定最efficient,可是可读,可重用,可查错。从而使solution或者说model更可靠,更
可重用。这些在software engineering里面都是很注重的。可是在analytics里面就很
少注重。

【在 A*******s 的大作中提到】
: 银行里数据还是比较简单吧,
: 而且也没什么必须要用online algorithm的场合
: solution只要能在一天内跑完就没人care啊
:
: SAS

A*******s
发帖数: 3942
15
其实原因很简单啊,supply and demand
懂统计又懂coding的人本来就稀少
都奔着data scientist的高工资跑了

【在 D******n 的大作中提到】
: 搞清楚之后,应该不复杂,问题大概没有谁比较清楚。
: 而且code efficiency的影响是多层次的。
: 一般可能就是觉得快了,或者只快一点。但这只是最直接的影响。一个好的code 不一
: 定最efficient,可是可读,可重用,可查错。从而使solution或者说model更可靠,更
: 可重用。这些在software engineering里面都是很注重的。可是在analytics里面就很
: 少注重。

D******n
发帖数: 2836
16
嗯,传统的统计curriculum 根本就不怎么教coding。
而且统计本来就是取sample,有时data错了还不怎么影响结果。
还有客户就是自己,差点,慢点,错点也无所谓。
但是当看到把 not(a and b)等价为 not a and not b还是很扼腕的。

【在 A*******s 的大作中提到】
: 其实原因很简单啊,supply and demand
: 懂统计又懂coding的人本来就稀少
: 都奔着data scientist的高工资跑了

s*********h
发帖数: 6288
17
我同意。
不是说ML高级。
只是regulation在那里,导致下面基本上只关心怎么满足上头的要求,不太愿意花人力
物力
去做其他的研究。

【在 D******n 的大作中提到】
: just means to an end, 不一定machine learning才更“高级”,也不是复杂的统计模
: 型比简单的logistic regression 管用。

s*********h
发帖数: 6288
18
我同意。不过risk很多地方我觉得可以用ML来做,但是据我所知真正在做的不多。
和reserve相关的没办法,一定得跟经济挂钩,可以理解。

data

【在 A*******s 的大作中提到】
: 业界里的machine learning
: 99%都是直接扔Y和X进去了事
: 现在热的data science,
: 难点也大多不在machine learning上面
: 况且machine learning也不是万能的,
: 要真搞causal inference,experimental design,longitudinal data,missing data
: ,survival analysis,sampling design这类东西还是得靠传统的statistics,
: econometrics也有很多可学的东西

w********e
发帖数: 944
19
你现在在做什么? 还是AML modeling?

【在 A*******s 的大作中提到】
: model validation应该会涵盖银行的所有model
: 作为一个在risk和aml呆过的model developer来说,
: 除了你说的logistic regression之外,
: 我搞过的东西有--
: model and simulate panel data with temporal and spatial correlation;
: competing risk Cox model;
: various forecasting models with exogenous variable;
: GLM & Double GLM;
: Copula;
: retrospective case-control matching;

D******n
发帖数: 2836
20
anti money laundary i guess

【在 w********e 的大作中提到】
: 你现在在做什么? 还是AML modeling?
相关主题
can SAS implement L1 Regularized Logistic Regression?有谁对 Finite Mixture Model 比较了解的吗?
找工作总结 [下]What models bank and credit cards companies use?
请教 这个GLM问题如何回答请教一个logistic regression的问题
进入Statistics版参与讨论
D******n
发帖数: 2836
21
基本是这样,
公司里面有数据,可是不给时间做research,
学术界里面可以做research,可是没有数据。
其实不一定要上ML,可是的确是有很多地方可以斟酌改良和做的更合理,问题那些都是
要通过实验和研究,公司里面不会让你那样做的,就算没有regulation,以profit为导
向的其他公司也不会花这个心思。

【在 s*********h 的大作中提到】
: 我同意。
: 不是说ML高级。
: 只是regulation在那里,导致下面基本上只关心怎么满足上头的要求,不太愿意花人力
: 物力
: 去做其他的研究。

z****n
发帖数: 1514
22


【在 A*******s 的大作中提到】
: model validation应该会涵盖银行的所有model
: 作为一个在risk和aml呆过的model developer来说,
: 除了你说的logistic regression之外,
: 我搞过的东西有--
: model and simulate panel data with temporal and spatial correlation;
: competing risk Cox model;
: various forecasting models with exogenous variable;
: GLM & Double GLM;
: Copula;
: retrospective case-control matching;

l*********s
发帖数: 5409
23
Because what software engineering tries to solve is rarely a problem for
data analyzing.
There is just not much demand for cross-over between the 2 skill sets.

【在 D******n 的大作中提到】
: 搞清楚之后,应该不复杂,问题大概没有谁比较清楚。
: 而且code efficiency的影响是多层次的。
: 一般可能就是觉得快了,或者只快一点。但这只是最直接的影响。一个好的code 不一
: 定最efficient,可是可读,可重用,可查错。从而使solution或者说model更可靠,更
: 可重用。这些在software engineering里面都是很注重的。可是在analytics里面就很
: 少注重。

s******0
发帖数: 1269
24
钱多人傻速来
只要你能忽悠,一切皆有可能
m*******1
发帖数: 855
25

not true
I build risk model, much more than just logistic regression

【在 f*******n 的大作中提到】
: 我是指credit risk model, 好像只有logistic regression,当然银行还有其他种类
: 的model。

l*****t
发帖数: 8319
26
就算是只做logistic。。你总要用varclus吧。。。总要做Bayesian impute missing吧
。。

【在 m*******1 的大作中提到】
:
: not true
: I build risk model, much more than just logistic regression

t********l
发帖数: 996
27
我是做MODEL VALIDATION的, 好像觉得没傻意思,还是喜欢DEVELOP,自己可以DESIGN
, CREATE, VALIDATION重复别人的东西,最多有个EFFECTIVE CHALLENGE 可以发挥。
r**a
发帖数: 536
28
银行里面,capital market derivative pricing model根本就没有ML啥事。ML只适合
处理physical measure下的数据,和risk neutral measure下的东西完全两回事。

【在 s*********h 的大作中提到】
: 这些东西还是很单调……
: 主要还是很多东西必须在BASEL框架里面。很难用现代的machine learning去做。

x******o
发帖数: 144
29
Model Validation有希望接触risk neutral pricing吗?感觉大多数bank,government
和rating都是招人去做Basel, stress test, Capital的啊

【在 r**a 的大作中提到】
: 银行里面,capital market derivative pricing model根本就没有ML啥事。ML只适合
: 处理physical measure下的数据,和risk neutral measure下的东西完全两回事。

e******g
发帖数: 7
30
去Investment Bank, validate trading models

government

【在 x******o 的大作中提到】
: Model Validation有希望接触risk neutral pricing吗?感觉大多数bank,government
: 和rating都是招人去做Basel, stress test, Capital的啊

相关主题
长周末了,还有人答疑么?关于CHI^2的。一个combine scored models的问题
银行AML职位面试credit risk scorecard一般是指retail credit risk吗?
offer请教请教model validation方面的面试
进入Statistics版参与讨论
c********s
发帖数: 101
31
LOL. Sounds like you've been through a lot...
Seriously, not a bad place to start. Exposure to almost every aspect of bank
's function. Don't expect to gain deep understanding of any model through
validation work though. You are on your own if you really want to be an
expert on something. Be prepared to have constant confrontations with a lot
of people. LOB usually knows more than you do about the model's real
application, what you think is a big deal may mean nothing to them. And no
one likes to be picked upon, human nature. Part of your job to deal with it.
Lay low and just do whatever your boss told you to do, keep him/her updated
on your progress all the time. Cover your own back, you should be fine.
MV hold the upper hand in corporate power struggle now, and they are booming
. Although I think they are on a losing steak and will fade away in a few
years. Who cares, as long as you are paid good money and have something to
add to your resume.
A lot of Chinese work in this field. Really hope they can hire more Chinese
and spread out throughout the bank later. Good luck.

【在 s******0 的大作中提到】
: 钱多人傻速来
: 只要你能忽悠,一切皆有可能

n****e
发帖数: 629
32
这个回帖非常好
我搬到quant去吧

bank
lot
it.
updated

【在 c********s 的大作中提到】
: LOL. Sounds like you've been through a lot...
: Seriously, not a bad place to start. Exposure to almost every aspect of bank
: 's function. Don't expect to gain deep understanding of any model through
: validation work though. You are on your own if you really want to be an
: expert on something. Be prepared to have constant confrontations with a lot
: of people. LOB usually knows more than you do about the model's real
: application, what you think is a big deal may mean nothing to them. And no
: one likes to be picked upon, human nature. Part of your job to deal with it.
: Lay low and just do whatever your boss told you to do, keep him/her updated
: on your progress all the time. Cover your own back, you should be fine.

1 (共1页)
进入Statistics版参与讨论
相关主题
What models bank and credit cards companies use?大家是对统计真得感兴趣还是只为了混口饭吃?
请教一个logistic regression的问题credit risk的大牛们,科普一下Credit Risk Parameters 吧!
长周末了,还有人答疑么?关于CHI^2的。Ms学校选择:NCSU stat 和Harvard Biostat
银行AML职位面试我工作中的致命弱点,求真心指教!! (转载)
offer请教问一个 classification 的问题
一个combine scored models的问题LOGISTIC REGRESSION需要DATA正态分布么?
credit risk scorecard一般是指retail credit risk吗?统计在保险业(Casualty & Property) 中的应用以及发展
请教model validation方面的面试can SAS implement L1 Regularized Logistic Regression?
相关话题的讨论汇总
话题: model话题: validation话题: data话题: 银行话题: bank