由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - lending club的notes 数据 (转载)
相关主题
问个modeling data size的问题讨论一下machine learning
R-square of logistic regressionT家面试题目求解答~~
How to test the difference between two C statistics (want the P请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD
bagging 用于logistic regression because of unbalance data报一个offer给大家打气,顺便问一下职业发展
如何做ordinal logistic regression的validation?a regression model test issue
What models bank and credit cards companies use?被猎头要SSN
统计专业找银行工作,需要有哪些金融的知识model和variables都sig.但每个category都不sig
MMM 和 Predictive modeling (logistic regression)比较问大牛们一个logistic model的问题哈
相关话题的讨论汇总
话题: lending话题: club话题: 数据话题: notes话题: logistic
进入Statistics版参与讨论
1 (共1页)
E**********e
发帖数: 1736
1
【 以下文字转载自 DataSciences 讨论区 】
发信人: ExpressoLove (MoneyForNothing), 信区: DataSciences
标 题: lending club的notes 数据
发信站: BBS 未名空间站 (Thu Apr 21 23:28:32 2016, 美东)
我利用空余时间做了下risk modeling。 之所以做,就是想用来构成投资建议。 比如
,开个户, 然后用自己的模型来选notes。
lending club的noets 有22% default rate,挺高的啊。 自己的模型能到AUC 0.702,
就是最简单的logistic regression。 random forest 和boosting 要低点。当然这个
跟没有细调参数有关。 不过还是想用logistic regression, 其他的方法只是作为个
参考。
同时也试着做了个kaggle的give me some credit。 目前logistic regression 可以到
0.8602. 这个比最好的0.8637要低点。 不够考虑模型的简单性, 结果也不错,对吧。
一个体会,就是数据预处理很重要。前段时间看到有人说道feature engineering,很
是赞同。简单处理数据,只能得到0.8, 但是用了feature engineering后就可以到0.
86.
开这个帖子就是想跟大家交流交流。 我在想lending club的数据是不是可以还能提高
点。 0.7不是很好, 最好可以上0.75. 那这样的预测才比较可靠。
谢谢。
S******y
发帖数: 1123
2
你所说的lendingClub里面的人都已经做过了
他们有一个组做underwriting 不少是从银行modeler跳过来的
欢迎浏览Python/R/Hadoop实战速成课网页-
http://plus.google.com/+statsGuyMITBBS/about
-------------------------------------------------------
2016年DS找工小贴士 系列之四:面试coding关
http://www.mitbbs.ca/article_t/Statistics/31394591.html
2016年DS找工小贴士 系列之三:Different data scientists
http://www.mitbbs.com/article_t/Statistics/31394519.html
E**********e
发帖数: 1736
3
那是肯定的啦。lendingclub的model估计也是0.7左右。
发个帖子看看有没有高人能做出更好的model。feature engineering看来是很重要的一
步。

:你所说的lendingClub里面的人都已经做过了
:他们有一个组做underwriting 不少是从银行modeler跳过来的
1 (共1页)
进入Statistics版参与讨论
相关主题
问大牛们一个logistic model的问题哈如何做ordinal logistic regression的validation?
最近捣鼓collaborative filterWhat models bank and credit cards companies use?
insurance company的statistician职位面试怎么准备?统计专业找银行工作,需要有哪些金融的知识
求 Predictive Modeling Using Logistic Regression Course Notes - SASMMM 和 Predictive modeling (logistic regression)比较
问个modeling data size的问题讨论一下machine learning
R-square of logistic regressionT家面试题目求解答~~
How to test the difference between two C statistics (want the P请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD
bagging 用于logistic regression because of unbalance data报一个offer给大家打气,顺便问一下职业发展
相关话题的讨论汇总
话题: lending话题: club话题: 数据话题: notes话题: logistic