码迷,mamicode.com
首页 > 其他好文 > 详细

推荐系统(2)

时间:2017-08-18 21:25:05      阅读:121      评论:0      收藏:0      [点我收藏+]

标签:特征处理   个性化   pca   输出   筛选   报告   数据报   冲突   业务   

用户画像就是根据用户的特征对用户的数学建模,可以用许多标签来表示,标签就是特征空间的维度

一、用户画像的作用

1.用户精细化运营

2.商户精细化运营支持

3.个性化

4.大数据报告

5.趋势预测

二。用户画像处理流程

1.明确问题和了解数据

  *需求和数据的匹配

  *明确需求

    分类、聚类、推荐和其他

  *数据的规模和重要特征的覆盖度

. 2.数据预处理

  *数据集成、数据冗余、数值冲突

  *数据采样

  *数据清洗、缺失值处理与噪声数据

3.特征工程的含义

数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限

特征:对所需解决问题有用的属性

特征的提取、选择和构造

  针对所解决的问题选择最有用的特征集合

  通过相关系数等方式来计算特征的重要性

    人工筛选

    有些算法输出特性:Random Forest

    维度过多,PCA自动降维

4.特征工程内容

  特征提取

    业务日志

    WEB公开数据抓取

    第三方合作

  特征处理

    特征清洗

    特征预处理:值处理、特征选择、特征组合、降维

    商业加工

  特征监控

    指标:时效性、覆盖率和异常值

    可视化&预警

5.模型与算法

三、用户画像架构

数据采集-------------->数据预处理--------->数据建模------------->数据的展示

      

  

  

推荐系统(2)

标签:特征处理   个性化   pca   输出   筛选   报告   数据报   冲突   业务   

原文地址:http://www.cnblogs.com/feiyumo/p/7391421.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!