mw 发帖数: 525 | 1 比较落后,现在才开始看boosted tree,看了半天也没有明白
1 Xgboost模型里面,到底有多少独立的,disconnected trees?我读介绍,我觉得只
有一个树啊,为什么我打印结果的时候确有很多独立的树?
2.每次chentq说要grow the tree, 这个tree到底是啥? 是建立一个新的tree,还是
binary split一个node,产生两个新的edges,和两个新的node
谁给介绍一下? |
M********0 发帖数: 1230 | 2
1. 任何GDBT或RF都是ensemble of trees 就是很多个决策树 RF的每个树是独立的
GDBT的则是有关联性的
每个树有自己的output 最后做一个majority vote
多少个树由n_estimator或ntree这个参数决定 这个参数可以pre-define 也可以通过
early-stopping自动选取(仅限GDBT)
每个树的深度 也就是你说的binary split层数 由max_depth参数决定 你还没有弄清
楚基本概念 建议回炉重造 读一读基本的bagging和boosting概念
2. 基于1的解释 grow the tree是指一个新的tree 因为xgb是GDBT 所以每个新的tree
都是基于之前的tree修正error的 参考boosting概念
【在 mw 的大作中提到】 : 比较落后,现在才开始看boosted tree,看了半天也没有明白 : 1 Xgboost模型里面,到底有多少独立的,disconnected trees?我读介绍,我觉得只 : 有一个树啊,为什么我打印结果的时候确有很多独立的树? : 2.每次chentq说要grow the tree, 这个tree到底是啥? 是建立一个新的tree,还是 : binary split一个node,产生两个新的edges,和两个新的node : 谁给介绍一下?
|
M********0 发帖数: 1230 | 3 更正上一楼的错误:
grow the tree应该是在同一个树上继续split |
mw 发帖数: 525 | 4 :-)
thx
【在 M********0 的大作中提到】 : 更正上一楼的错误: : grow the tree应该是在同一个树上继续split
|