码迷,mamicode.com
首页 > 编程语言 > 详细

Python高级应用程序设计任务要求

时间:2019-12-19 09:25:03      阅读:84      评论:0      收藏:0      [点我收藏+]

标签:网络爬虫   最新   com   获取   程序设计   难点   结构   网页   文件中   

用Python实现一个面向主题的网络爬虫程序,并完成以下内容:
(注:每人一题,主题内容自选,所有设计内容与源代码需提交到博客园平台)

一、主题式网络爬虫设计方案(15分)

1.主题式网络爬虫名称

    名称:爬取电影天堂华语电视剧信息和下载链接

2.主题式网络爬虫爬取的内容与数据特征分析

    本次爬虫主要爬取电影天堂华语电视剧信息
3.主题式网络爬虫设计方案概述(包括实现思路与技术难点)

     本次设计方案依靠request库访问,用BeautifulSoup分析网页结构获取数据,采集信息进行数据持久化,保存在本地文件中。

  技术难点主要包括对页面结构分析、对数据的采集和数据持久化。

 

二、主题页面的结构特征分析(15分)
1.最新电影列表页面结构分析

技术图片

 

Python高级应用程序设计任务要求

标签:网络爬虫   最新   com   获取   程序设计   难点   结构   网页   文件中   

原文地址:https://www.cnblogs.com/zhuangweisong/p/12065779.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!