标签:格式 需要 分组 purchase http 多个 虚拟变量 其他 工程
特征表达
接下来要谈到的特征工程类型虽然简单却影响巨大。我们将其称为特征表达。
你的数据并不一定总是理想格式。你需要考虑是否有必要通过另一种形式进行特征表达以获取有用信息。
见:http://www.infoq.com/cn/news/2017/08/Analysis-practices-Feature-Engin
机器学习特征表达——日期与时间特征做离散处理(数字到分类的映射),稀疏类分组(相似特征归档),创建虚拟变量(提取新特征) 本质就是要么多变少,或少变多
标签:格式 需要 分组 purchase http 多个 虚拟变量 其他 工程
原文地址:http://www.cnblogs.com/bonelee/p/7327506.html