标签:好的 nbsp 大于等于 二叉树 分数 特征 获得 预测 表示
树回归
当回归的数据呈现非线性时,就需要使用树回归。
获得最好的切分特征和切分特征值
遍历所有特征
针对某一特征,遍历该特征的所有值
针对某一特征值,进行划分数据,计算出划分数据之后的总方差,
若总方差最小,记下特征和特征值
当遍历完所有特征后,就能够获得最小方差的特征和特征值,并以此作为树的结点,划分左右子树,
若没有特征,就返回特征值
左子树为大于等于特征值的样本集合,
右子树为小于特征值的样本集合
构建字典,保存特征、特征值、左子树和右子树
针对各个子树,再重复上面的操作。
终止的条件为:
样本数小于某个数值(如4)和总方差下降的最低值(如1)
叶子结点取目标值的平均值
最后构建出一颗倒着长的二叉树,内部结点为特征和特征值,叶子结点为某一数值,表示在特定路径下的预测目标值。
标签:好的 nbsp 大于等于 二叉树 分数 特征 获得 预测 表示
原文地址:https://www.cnblogs.com/gwzz/p/13576498.html