码迷,mamicode.com
首页 > 其他好文 > 详细

影评推荐系统

时间:2018-12-17 02:10:34      阅读:170      评论:0      收藏:0      [点我收藏+]

标签:ide   数据   搜索引擎   link   搜索   评分   scrapy   技术   ima   

1、创建django

创建文件夹保存文件:

mkdir 文件夹

cd 文件夹

django-admin startproject  项目名称

在项目下创建应用

技术分享图片

 

影评数据采用爬虫知识,使用scrapy库从bing搜索引擎采取和抽取

1、爬取数据

必应英语:Bing,台港称Bing)是一款由微软公司推出的网络搜索引擎

 

 

简短几十行代码之后你已经能够开始抓取一部电影的全部短评和评分了。在这之前,记得在settings里加一个DOWNLOAD_DELAY = 2,不然的话爬不到一半就会被豆瓣给禁了。

 我们的应用(spider文件夹)使用两个蜘蛛:

一只从影评URL抽取数据(movice_link_results.py)

另外一只生成所有链接到初始影评URL的网页连接图(recursive_link_results.py)

 

将爬取到的数据保存到Django model PageItem中

 

影评推荐系统

标签:ide   数据   搜索引擎   link   搜索   评分   scrapy   技术   ima   

原文地址:https://www.cnblogs.com/foremostxl/p/10129028.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!