E**********e 发帖数: 1736 | 1 【 以下文字转载自 DataSciences 讨论区 】
发信人: ExpressoLove (MoneyForNothing), 信区: DataSciences
标 题: lending club的notes 数据
发信站: BBS 未名空间站 (Thu Apr 21 23:28:32 2016, 美东)
我利用空余时间做了下risk modeling。 之所以做,就是想用来构成投资建议。 比如
,开个户, 然后用自己的模型来选notes。
lending club的noets 有22% default rate,挺高的啊。 自己的模型能到AUC 0.702,
就是最简单的logistic regression。 random forest 和boosting 要低点。当然这个
跟没有细调参数有关。 不过还是想用logistic regression, 其他的方法只是作为个
参考。
同时也试着做了个kaggle的give me some credit。 目前logistic regression 可以到
0.8602. 这个比最好的0.8637要低点。 不够考虑模型的简单性, 结果也不错,对吧。
一个体会,就是数据预处理很重要。前段时间看到有人说道feature engineering,很
是赞同。简单处理数据,只能得到0.8, 但是用了feature engineering后就可以到0.
86.
开这个帖子就是想跟大家交流交流。 我在想lending club的数据是不是可以还能提高
点。 0.7不是很好, 最好可以上0.75. 那这样的预测才比较可靠。
谢谢。 |