本篇博客主要用于介绍如何使用selenium+phantomJS模拟登陆豆瓣,没有考虑验证码的问题,更多内容,请参考:Python学习指南 期初使用driver = webdriver.PhantomJS(),返回的只是,增加了参数就可以了 ...
分类:
编程语言 时间:
2018-12-18 02:05:12
阅读次数:
235
本章将介绍tcp网络编程,更多内容请参考:Python学习指南 Socket是网络编程的一个抽象概念,通常我们用一个Socket表示"打开了一个网络连接",而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。 客户端 大多数连接都是可靠的TCP连接。创建TCP连接时,主动 ...
分类:
编程语言 时间:
2018-12-18 02:04:14
阅读次数:
163
本篇将介绍urllib2的Get和Post方法,更多内容请参考:python学习指南 urllib2默认只支持HTTP/HTTPS的GET和POST方法 urllib.urlencode() urllib和urllib2都是接受URL请求的相关参数,但是提供了不同的功能。两个最显著的不同如下: ur ...
分类:
编程语言 时间:
2018-12-18 00:09:06
阅读次数:
280
python爬虫(四)_urllib2库的基本使用 本篇我们将开始学习如何进行网页抓取,更多内容请参考:python学习指南 urllib2库的基本使用 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。在Python中有很多库可以用来抓取网页,我们先学习urllib2。 ...
分类:
编程语言 时间:
2018-12-18 00:02:01
阅读次数:
275
本章将结合先前所学的爬虫和正则表达式知识,做一个简单的爬虫案例,更多内容请参考:Python学习指南 现在拥有了正则表达式这把神兵利器,我们就可以进行对爬取到的全部网页源代码进行筛选了。 下面我们一起尝试一下爬取内涵段子网站: http://www.neihan8.com/article/list_ ...
分类:
编程语言 时间:
2018-12-17 23:59:16
阅读次数:
361
python爬虫(一)_爬虫原理和数据抓取 本篇将开始介绍Python原理,更多内容请参考:Python学习指南 为什么要做爬虫 著名的革命家、思想家、政治家、战略家、社会改革的主要领导人物马云曾经在2015年提到由IT转到DT,何谓DT,DT即数据技术,由数据在推倒人们的衣食住行,当今时代是一个大 ...
分类:
编程语言 时间:
2018-12-17 23:57:09
阅读次数:
406
本文将介绍handler处理器和自定义opener,更多内容请参考:python学习指南 opener和handleer 我们之前一直使用的是urllib2.urlopen(url)这种形式来打开网页,它是一个特殊的opener(也就是模块帮我们建好的),opener是urllib2.OpenerD ...
分类:
编程语言 时间:
2018-12-17 23:49:09
阅读次数:
269
什么是异常 异常是程序发生错误的信号,一旦程序出错就会产生一种类型的异常,如果该异常没有被程序处理,就抛出来 程序的运行也随即终止为何要处理异常 为了保障的健壮性如何处理异常 错误分为两大类: 1: 语法错误: 应该在程序运行前就立即改正 2: 逻辑错误: 2.1 如果错误的发生的条件是可以预知的应 ...
分类:
编程语言 时间:
2018-12-16 23:21:11
阅读次数:
228
内置方法:__str__(该方法必须返回字符串类型),在对像被打印时自动触发,然后将该方法的返回值当做打印结果输出) 内置方法:__del__(会在对象被删除时自动触发,我们可以在__del__内做一些回收系统资源的事) ...
分类:
编程语言 时间:
2018-12-16 20:33:21
阅读次数:
107
Python基础知识(34):电子邮件(Ⅰ) 几乎所有的编程语言都支持发送和接收电子邮件 在使用Python收发邮件前,请先准备好至少两个电子邮件,如xxx@163.com,xxx@sina.com,xxx@qq.com等,注意两个邮箱不要用同一家邮件服务商 电子邮件发送过程: 发件人email-> ...
分类:
编程语言 时间:
2018-12-16 20:31:39
阅读次数:
299