标签:urllib 实例 题目 网络爬虫 静态 输入 资源 常用 推荐
9月5日
今天早晨学习了网易云课程《Python做Web工程师课程》提前预习课程《学会开发静态网页》。轻松的完成了第五节课的两个实战作业——感觉自己这几天的功夫没有白费,总算学会了点儿东西,即使是非常浅薄也满足感爆棚。
也浏览了一遍第6节课<用css定制10MINs首页(上)>和第7节课<用css定制10MINs首页(下)>,第一遍看有点乱,没明白。明天天的学习方向是将这两节课重新仔细的学习一遍,并且记录笔记,完成作业。
下午学习了中国大学Mooc课程嵩天老师的《Python网络爬虫与信息提取》,浏览了一遍第三周的课程《网络爬虫之实战》的:
单元7:Re(正则表达式)库入门
单元8:实例2:淘宝商品比价定向爬虫
单元9:实例3:股票数据定向爬虫。
抄写分析了一遍实例2的代码:淘宝商品比价定向爬虫。
出了正则表达式有一点点疑问之外,逻辑都搞懂了。
明天的学习方向是抄写分析一遍股票数据定向爬虫,以及再重新抄写输入一遍淘宝商品比价定向爬虫。这两件事情做完以后,再重新看一遍嵩老师的课程,并且记录笔记,手动过一遍代码。
深入理解Re正则表达式。
晚上学习了《小甲鱼Python零基础入门课程》的第三课:<003小插曲之变量和字符串>以及<004改进我们的小游戏>,并且完成了昨天听的两节课的课后作业:<001愉快的开始>与<我和Python的第一次亲密接触>,学到了一些新的东西,巩固了一点儿基础知识。明天继续学习<005闲聊之Python的数据类型>,以及<006Python之常用操作符>,并且完成003和004的课后作业。
关于基础知识目前方向有点乱,我不知道课程作业应该像这样隔一天做还是当天做。
关于基础知识的学习,要有个大概的时间概念:一个月,小甲鱼新手课程有53讲:刚好一个月的时间跟着课程走完一遍基础课程,如果每天两节的话。还是比较理想的。
还有一点就是在学习的《Learn Python hard way》这本书的第26章的练习题目前没有一个时间来做,我要思考一个折中的方案调剂这几种学习方法,目前没有好的办法。
今天令我印象深刻的一件事情是:互联网编程语言真是日新月异。书本是非常不可靠的,有很大的机会学到已经淘汰的知识,必须依靠网络资源。我前两天在看的一本书《用Python写网络爬虫》里推荐用爬虫的模块urllib2,我以为是比requests库更强大的模块呢,学习了好一会儿。今天浏览小甲鱼网站的时候看到一篇文章写《requests库的强大功能》里面说requests库是新的库,比很多旧的爬虫库都要简便,受欢迎。这件事情对我的触动挺大的,我买的再多的关于互联网编程的书,也不可能用来学习最新知识。可是就算是基础知识,在理念上也是错误的。幸好我信奉一点儿“博闻强识”的说法。我觉得这件事情所蕴含的道理其实并没有所感觉到的那么简单。从这件事放开讲,别的所有的关于互联网技术的知识也是这样,要随时关注学习最新的,最简洁的,最搞笑稳定的知识。
总之一句话,积极练习使用requests库,培养互联网学习的习惯为主,书本为辅助的习惯。
标签:urllib 实例 题目 网络爬虫 静态 输入 资源 常用 推荐
原文地址:http://www.cnblogs.com/liang-song-you/p/7482507.html