标签:art 要求 怎么 div 线性 决策树 提升 原因 方式
1.捕捉A、B变量中的(A强,B弱|A弱、B强)(A中,B中)这样的特征情况,可以用决策树方法(cart)先对A/B变量分箱,然后对分箱结果编码,
然后对分箱结果相乘生成新变量,里面就会有上面说的这种组合变量出现。
这也是为什么好多方法中,先生成一个模型,然后再将这个模型的结果作为一个变量进入另一个模型中,结果会比较好的原因。
2.在对连续变量的处理方式上
1)分箱简单,且可以增强模型稳定性,实际业务中,越简单解释性越强越好。
2)分箱满足模型效果要求,你用后者方法一顿操作,效果可能没有什么提升
3)分箱主要是用于处理连续型变量,这个你不分箱还能怎么做呢
标签:art 要求 怎么 div 线性 决策树 提升 原因 方式
原文地址:https://www.cnblogs.com/ironan-liu/p/11433088.html