GBDT
GBDT,全称Gradient Boosting Decision Tree。
CART
在GBDT中使用的回归树模型为CART。其算法为
[1]对于每个节点处,当前数据集为D={(x1,y1),(x2,y2),...,(xn,yn)},对于每个特征j,寻找最优划分节点s,使得据此可将D划分为R1和R2,满足
j,smin[xi∈R1∑(yi−c1)2+xi∈R2∑(yi−c2)2]
其中
c1=N11xi∈R1∑yi
c2=N21xi∈R2∑yi
[2]对于每棵划分出来的子树,递归进行操作[1],直到满足停止条件。
[3]返回树T。
另外,若是分类树,则其划分依据为最小基尼指数
Gini(D,A)=∣D∣∣D1∣Gini(D1)+∣D∣∣D2∣Gini(D2)
当样本数少于既定阈值或样本Gini指数小于既定基尼指数或没有更多特征时则停止划分。这里不详述。
下面讲述剪枝过程。
[1]设k=0,T=T0,a=+∞
[2]自下而上对内部节点t计算:
g(t)=∣Tt∣−1Ct−C(Tt)
a=min(a,g(t))
[3]自上而下的访问内部节点t,对最小的g(t)=a进行剪枝,并对叶节点t以多数表决形式决定其类别,得到树T
[4]k=k+1,ak=a,Tk=T
[5]如果T为非单节点树,返回[3]
[6]对于产生的子树序列{T0,T1,...,Tn}分别计算损失,得到最优子树T∗并返回。
梯度提升
GBDT作为boosting类模型中的一种,采用迭代的方式对学习器进行优化。假设前一轮迭代得到强学习器ft−1(x),损失函数为L(y,ft−1(x)),则本轮迭代目标为寻找CART回归树模型的弱学习器ht(x),使得本轮损失L(y,
继续阅读与本文标签相同的文章
深度语义模型以及在淘宝搜索中的应用
深度学习与人工智能革命:part IV
-
两问快递涨价
2026-05-19栏目: 教程
-
一图了解顺丰全球供应链网络布局
2026-05-19栏目: 教程
-
这款 IDE 插件再次升级,让「小程序云」的开发部署提速 8 倍
2026-05-19栏目: 教程
-
专注于技术能力提升的央企,注定不平凡,我有看点!
2026-05-19栏目: 教程
-
男友力爆棚的Mac电脑办公软件WPS Office
2026-05-19栏目: 教程
