|
|
|
|
|
|
m******r 发帖数: 1033 | 1 我以前没做过树模型,清一色都是回归,还都是线性回归。 缺点当然是不准,世界本
来就不是线性的。优点其实也很明显,容易解释。 比如credit bureau 说的信用分数
不是满分原因是:
1. 信用历史短
2. 信用花的多
虽然他们不是用这种直白语言说的,但我还是买账的。 可能在我那个信用group里,历
史算是短的。 信用卡虽然从来没有透支,但每个月老用信用卡,信用比率大于50%,也
是可信的。 何况多短算是短? 花多少算是多? 本来也没个标准。
再比如你去看医生,血压高了,就是高血压,容易脑中风,脑溢血; 血压低了就是低
血压,血压没了,就嗝屁了; 血糖高了,就是高血糖,血糖低了,就是低血糖;血糖
没了 人也就没了。可见这个世界还是需要这些简单的趋势的。
言归正传。 如果你用随机森林,多级树,近邻法,就没法向人展示这些趋势。我想到
的一个可能的办法,是弄个地图一样的东西,heat map, 你的分数恰好落在在一线城市
附近,你就是一类客户,落在二线城市附近,你就是二类客户, etc 。 那么如何把多
级树,转化成地图一样的东西 ?
不知道这个东西能不能扩展到高维? 有什么软件包可以支持的? 如果是线性回归,某
客户过来问他为什么是一等,二等,三等客户,那很简单: 假设你的线性模型由10个
变量组成,你分别看看他每个变量落在第几等就是了。 | g****t 发帖数: 31659 | 2 你用linear regression模型不查误差吗?
不是一定要严格的iid,至少误差需要不互相干扰才行。
你说线性回归。人家找个excel算出来误差ACF有某个点的超级peak都没处理掉。
那就笑话大了。这些细节不是直白的解释可以覆盖的。
不做细,靠语言解释线性模型就和划线炒股一样的。后果难料。
非线性模型也一样,都有背景知识。看你打算做到哪一步了。
其实对绝大多数人来说,我觉得线性模型和各种adaptive method熟练才是
ML混饭吃的正道。把线性模型弄好了,什么名字流行就改一改,加个帽子轻而易举的。
话说线性模型elementwise的截断一下不就是RNN嘛?
【在 m******r 的大作中提到】 : 我以前没做过树模型,清一色都是回归,还都是线性回归。 缺点当然是不准,世界本 : 来就不是线性的。优点其实也很明显,容易解释。 比如credit bureau 说的信用分数 : 不是满分原因是: : 1. 信用历史短 : 2. 信用花的多 : 虽然他们不是用这种直白语言说的,但我还是买账的。 可能在我那个信用group里,历 : 史算是短的。 信用卡虽然从来没有透支,但每个月老用信用卡,信用比率大于50%,也 : 是可信的。 何况多短算是短? 花多少算是多? 本来也没个标准。 : 再比如你去看医生,血压高了,就是高血压,容易脑中风,脑溢血; 血压低了就是低 : 血压,血压没了,就嗝屁了; 血糖高了,就是高血糖,血糖低了,就是低血糖;血糖
| w********m 发帖数: 1137 | 3 线性模型最大的优点是灵活,可以调单个变量的参数。
老板或者监管要什么结果,手动一下,就能出结果。
黑的变白的分分钟的事情。
以前调参活好的弟兄,都升到高层去了。
非线性的也可以调,但是不好画圆圈。 |
|
|
|
|
|