码迷,mamicode.com
首页 > 其他好文 > 详细

个人爬虫入门记录20171026

时间:2017-10-26 15:18:43      阅读:116      评论:0      收藏:0      [点我收藏+]

标签:python 爬虫 文本处理

      网易NBA对每个队都有一个对应的编号,每个编号对应一个数据页面。想要进入马刺的数据页面,首先要知道马刺的编号。编号与球队名字的对应关系可以从总体的NBA统计页面源代码中看到。所以,我的思路是:

       1.获得NBA统计页面的源代码;

       2.将源代码转换成字符串;

       3.通过查找球队名字获得球队名在字符串中的位置,对应的编码的位置也在球队名字附近,把球队              编码返回出来;

       4.通过球队的编码去查找马刺的数据统计页面

昨晚上按照上面的思路写了几行代码,结果不对。问题出在,在字符串中用find()方法查找球队名字,返回结果为空,问题出在哪里没想出来。正好到点睡觉就睡了。

本文出自 “8097414” 博客,请务必保留此出处http://8107414.blog.51cto.com/8097414/1976321

个人爬虫入门记录20171026

标签:python 爬虫 文本处理

原文地址:http://8107414.blog.51cto.com/8097414/1976321

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!