标签:特征处理 个性化 pca 输出 筛选 报告 数据报 冲突 业务
用户画像就是根据用户的特征对用户的数学建模,可以用许多标签来表示,标签就是特征空间的维度
1.用户精细化运营
2.商户精细化运营支持
3.个性化
4.大数据报告
5.趋势预测
*需求和数据的匹配
*明确需求
分类、聚类、推荐和其他
*数据的规模和重要特征的覆盖度
*数据集成、数据冗余、数值冲突
*数据采样
*数据清洗、缺失值处理与噪声数据
数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限
特征:对所需解决问题有用的属性
特征的提取、选择和构造
针对所解决的问题选择最有用的特征集合
通过相关系数等方式来计算特征的重要性
人工筛选
有些算法输出特性:Random Forest
维度过多,PCA自动降维
特征提取
业务日志
WEB公开数据抓取
第三方合作
特征处理
特征清洗
特征预处理:值处理、特征选择、特征组合、降维
商业加工
特征监控
指标:时效性、覆盖率和异常值
可视化&预警
数据采集-------------->数据预处理--------->数据建模------------->数据的展示
标签:特征处理 个性化 pca 输出 筛选 报告 数据报 冲突 业务
原文地址:http://www.cnblogs.com/feiyumo/p/7391421.html