标签:规则 lock 提取 需求 页面 电影 相关 第三方 爬取
需求:爬取豆瓣电影TOP250
*向用户展示电影的排名,分数,名字,简介,导演,演员,前10条影评信息,链接信息
实现思路:
- 分析豆瓣电影TOP250的url规则, 编写模块获取相关url
- 获取全部相关页面的html代码
- 分析html中有关"排名,分数,名字,简介,导演,演员,前10条影评信息,链接信息"的标签
- 结合第三方工具包实现信息的提取
- 编写将"搜集信息"展示出来的模块
标签:规则 lock 提取 需求 页面 电影 相关 第三方 爬取
原文地址:http://www.cnblogs.com/wangzixuan111/p/7496189.html