协同过滤(collaborative filtering )能自行学习所要使用的特征 如我们有某一个数据集,我们并不知道特征的值是多少,我们有一些用户对电影的评分,但是我们并不知道每部电影的特征(即每部电影到底有多少浪漫成份,有多少动作成份) 假设我们通过采访用户得到每个用户的喜好,如上图中的Ali ...
分类:
其他好文 时间:
2017-09-18 22:35:57
阅读次数:
326
需求:爬取豆瓣电影TOP250 *向用户展示电影的排名,分数,名字,简介,导演,演员,前10条影评信息,链接信息 实现思路: 分析豆瓣电影TOP250的url规则, 编写模块获取相关url 获取全部相关页面的html代码 分析html中有关"排名,分数,名字,简介,导演,演员,前10条影评信息,链接 ...
分类:
其他好文 时间:
2017-09-08 21:54:04
阅读次数:
138
需求:爬取豆瓣电影TOP250 *向用户展示电影的排名,分数,名字,简介,导演,演员,前10条影评信息,链接信息 实现思路: 分析豆瓣电影TOP250的url规则, 编写模块获取相关url 获取全部相关页面的html代码 分析html中有关"排名,分数,名字,简介,导演,演员,前10条影评信息,链接 ...
分类:
编程语言 时间:
2017-09-08 21:49:18
阅读次数:
179
团队-爬取豆瓣电影TOP250-需求分析 需求:爬取豆瓣电影TOP250 *向用户展示电影的排名,分数,名字,简介,导演,演员,前10条影评信息,链接信息 实现思路: 分析豆瓣电影TOP250的url规则, 编写模块获取相关url 获取全部相关页面的html代码 分析html中有关"排名,分数,名字 ...
分类:
其他好文 时间:
2017-09-08 21:38:33
阅读次数:
150
最近很想看的一个电影,去知乎上看一下评论,刚好在学Python爬虫,就做个小实例。 代码基于第三方修改 原文链接 http://python.jobbole.com/88325/#comment-94754 ...
分类:
编程语言 时间:
2017-09-05 19:00:42
阅读次数:
138
如何对电影进行打分:根据用户向量与电影向量的内积 我们假设每部电影有两个features,x1与x2。x1表示这部电影属于爱情片的程度,x2表示这部电影是动作片的程度,如Romance forever里面x1为1.0(说明电影大部分为爱情),x2=0.01(说明里面有一点动作场面)。 还是像以前一样 ...
分类:
其他好文 时间:
2017-08-24 16:43:19
阅读次数:
258
数据介绍 neg.txt:5331条负面电影评论 pos.txt:5331条正面电影评论 函数包 自然语言工具库 Natural Language Toolkit 下载nltk相关数据: 测试安装是否成功: 常用的函数有两个: 调用形式如下: 程序介绍 载入函数库以及数据文件名 词汇表建立 词汇表, ...
分类:
其他好文 时间:
2017-08-20 18:25:36
阅读次数:
200
中午吃饭没事,打开电视看了这部旧电影,还可以,算是华仔近些年拍的不错的电影。故事就是围绕223绑架案进行,中间情节有些穿差不知道为啥这样反而减少来悬念,为什么不全部按时间顺序正着排呢。影评的结局还好,毕竟只是在真实绑架案基础上增加了一些虚构的故事和人物。看完影片有下面几点想法。 第一是比较可气的不守 ...
分类:
其他好文 时间:
2017-08-05 15:32:36
阅读次数:
133
《辛德勒名单》是美国著名导演史蒂芬.斯皮尔伯格于1993年拍摄的一部轰动世界的伟大作品,深刻地揭露了德国法西斯疯狂屠杀犹太人的恐怖罪行,以其极高的艺术性成为1994年全球最为瞩目的一部影片,其思想的严肃性、非凡的艺术表现力都达到了几乎难以超越的高度。整部影片时间长达3小时15分钟,将近两个标准商业片 ...
分类:
其他好文 时间:
2017-07-25 10:22:37
阅读次数:
127
昨天在回杭的高铁上,想要清理手机时看了这部在手机上放了很久都没看的电影,能拜托堕胎、车祸这样的青春片代名词,是这部电影值得肯定的地方,毕竟这些肯定不是大部分人青春最重要的东西。 在这个青春片泛滥的年代,电影《谁的青春不迷茫》摆脱了内地很多青春片惯有的那种车祸、堕胎的剧情,而让大众对这部电影增加了一丝 ...
分类:
其他好文 时间:
2017-07-22 12:14:01
阅读次数:
139