码迷,mamicode.com
首页 > 其他好文 > 详细

个人爬虫入门记录20171025

时间:2017-10-25 23:55:29      阅读:171      评论:0      收藏:0      [点我收藏+]

标签:python 爬虫 文本处理

     作为一个NBA马刺的粉丝,我想看到比赛的数据,比如比分、场均得分、助攻等等,网易NBA有专门的数据页面来展示这些数据,所以我想通过爬虫的方法,把数据抓取下来,按照我自己的想法去展示。

      从网上下载了一段代码,试跑了一下,能把网页的源代码下载下来。那我觉得接下来的工作就是文本处理,或者说其实爬虫的主要工作就是文本处理。从源代码中,获取、定位、剥离、存储我所需要的文本。

个人爬虫入门记录20171025

标签:python 爬虫 文本处理

原文地址:http://8107414.blog.51cto.com/8097414/1976062

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!