数据来源? 购买(政府、阿里巴巴、数据交易所) 爬虫 数据采集(机器人、无人驾驶、人工智慧) 获得的是原始数据 什么是数据清洗? 按照需求分析,过滤出有效的完整的数据,放入数据仓库 etc 数据清洗转换 有哪些应用? 商品、 新闻推荐 信贷、个人信用 婚姻(珍爱网) 舆论检测平台 医疗(全民健康档案 ...
分类:
其他好文 时间:
2017-07-07 13:18:56
阅读次数:
149
1.背景 最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。2.数据集一共五个字段,以tab隔开。分别是user编号,news编号,时间编号,新闻标题,对应当前月份的日...
分类:
编程语言 时间:
2014-09-25 10:43:58
阅读次数:
947
本文是对Personalized News Recommendation Based on
ClickBehavior 论文的阅读记录协同过滤推荐新闻根据用户浏览点击的相似,在推荐新闻方面主要有两个缺点:1first-raterproblem
不能给用户推荐别的用户还没有阅读过的新闻,新的新闻是随着...
分类:
其他好文 时间:
2014-06-12 15:41:57
阅读次数:
234