[请教]树模型，该如何向客户解释？ - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - [请教]树模型，该如何向客户解释？

相关主题
● 单变量xgboost模型好的吓人，求解	● CNN做NLP工程多吗？
● 问几个神经网络的问题	● 为什么grid search伤人品
● 我来科普下深度学习的应用范围吧	● groovy 不错啊
● 业余时间想做一个project	● Facebook的用CNN作翻译怎么性能超过RNN的
● 计算和学习根本就是两回事	● [bssd] Neural network as a programming language
● LSTM 是不是坨屎？	● 深度学习对时间序列数据有什么好办法吗？
● 想上手deep learning的看过来	● ｃｎｎ大牛们，这种特征如何提取呢？
● 对于现在machine learning有个问题，请指教	● 胡扯几句什么叫Deep Learning入门

相关话题的讨论汇总
话题: 模型话题: 线性话题: 客户话题: 信用话题: 回归

进入Programming版参与讨论

1

(共1页)

m******r 发帖数: 1033	1 我以前没做过树模型，清一色都是回归，还都是线性回归。缺点当然是不准，世界本来就不是线性的。优点其实也很明显，容易解释。比如credit bureau 说的信用分数不是满分原因是： 1. 信用历史短 2. 信用花的多虽然他们不是用这种直白语言说的，但我还是买账的。可能在我那个信用group里，历史算是短的。信用卡虽然从来没有透支，但每个月老用信用卡，信用比率大于50%，也是可信的。何况多短算是短？花多少算是多？本来也没个标准。再比如你去看医生，血压高了，就是高血压，容易脑中风，脑溢血；血压低了就是低血压，血压没了，就嗝屁了；血糖高了，就是高血糖，血糖低了，就是低血糖；血糖没了人也就没了。可见这个世界还是需要这些简单的趋势的。言归正传。如果你用随机森林，多级树，近邻法，就没法向人展示这些趋势。我想到的一个可能的办法，是弄个地图一样的东西，heat map, 你的分数恰好落在在一线城市附近，你就是一类客户，落在二线城市附近，你就是二类客户， etc 。那么如何把多级树，转化成地图一样的东西？不知道这个东西能不能扩展到高维？有什么软件包可以支持的？如果是线性回归，某客户过来问他为什么是一等，二等，三等客户，那很简单：假设你的线性模型由10个变量组成，你分别看看他每个变量落在第几等就是了。
g****t 发帖数: 31659	2 你用linear regression模型不查误差吗？不是一定要严格的iid，至少误差需要不互相干扰才行。你说线性回归。人家找个excel算出来误差ACF有某个点的超级peak都没处理掉。那就笑话大了。这些细节不是直白的解释可以覆盖的。不做细,靠语言解释线性模型就和划线炒股一样的。后果难料。非线性模型也一样，都有背景知识。看你打算做到哪一步了。其实对绝大多数人来说，我觉得线性模型和各种adaptive method熟练才是 ML混饭吃的正道。把线性模型弄好了，什么名字流行就改一改，加个帽子轻而易举的。话说线性模型elementwise的截断一下不就是RNN嘛? 【在 m******r 的大作中提到】 : 我以前没做过树模型，清一色都是回归，还都是线性回归。缺点当然是不准，世界本 : 来就不是线性的。优点其实也很明显，容易解释。比如credit bureau 说的信用分数 : 不是满分原因是： : 1. 信用历史短 : 2. 信用花的多 : 虽然他们不是用这种直白语言说的，但我还是买账的。可能在我那个信用group里，历 : 史算是短的。信用卡虽然从来没有透支，但每个月老用信用卡，信用比率大于50%，也 : 是可信的。何况多短算是短？花多少算是多？本来也没个标准。 : 再比如你去看医生，血压高了，就是高血压，容易脑中风，脑溢血；血压低了就是低 : 血压，血压没了，就嗝屁了；血糖高了，就是高血糖，血糖低了，就是低血糖；血糖
w********m 发帖数: 1137	3 线性模型最大的优点是灵活，可以调单个变量的参数。老板或者监管要什么结果，手动一下，就能出结果。黑的变白的分分钟的事情。以前调参活好的弟兄，都升到高层去了。非线性的也可以调，但是不好画圆圈。

1

(共1页)

进入Programming版参与讨论

相关主题
● 胡扯几句什么叫Deep Learning入门	● 计算和学习根本就是两回事
● Keras 现在支持mxnet了	● LSTM 是不是坨屎？
● 有没有做sentiment analysis的，求思路	● 想上手deep learning的看过来
● 数值计算	● 对于现在machine learning有个问题，请指教
● 单变量xgboost模型好的吓人，求解	● CNN做NLP工程多吗？
● 问几个神经网络的问题	● 为什么grid search伤人品
● 我来科普下深度学习的应用范围吧	● groovy 不错啊
● 业余时间想做一个project	● Facebook的用CNN作翻译怎么性能超过RNN的

相关话题的讨论汇总
话题: 模型话题: 线性话题: 客户话题: 信用话题: 回归

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)