在上一篇python使用xslt提取网页数据中,要提取的内容是直接从网页的sourcecode里拿到的。但是对于一些Ajax或动态html,很多时候要提取的内容是在sourcecode找不到的,这种情况就要想办法把异步或动态加载的内容提取出来。python中可以使用selenium执行javascript,selenium可以..
分类:
编程语言 时间:
2016-05-19 19:39:00
阅读次数:
231
在python使用xslt提取网页数据一文中,使用xslt来提取目标网页上的内容。示例的小程序,直接把一长段xslt赋值给变量。原文没有讲这一段xslt是怎么来的。有的网友有疑问,这个xslt这么长,编写不是要花很长时间?实际情况是,这个xslt是通过GooSeeker谋数台的直观标注来自动生成..
分类:
Web程序 时间:
2016-05-19 19:36:49
阅读次数:
172
lxml是python的一个库,可以迅速、灵活地处理XML。它支持XMLPathLanguage(XPath)和ExtensibleStylesheetLanguageTransformation(XSLT),并且实现了常见的ElementTreeAPI。这2天测试了一下在python中通过xslt来提取网页内容,记录如下:1.要提取集搜客官网旧版论坛的帖子标题和..
分类:
编程语言 时间:
2016-05-16 20:10:17
阅读次数:
265
Python和其他语言有一个很大的区别在于:Python 使用硬回车来分割语句,使用冒号(:)和缩进来分割代码块。同一层次的语句必须有相同的缩进(每一组这样的语句称为一个块),而C语言风格的编程语言(Java/C#/C++)则使用分号来分割语句,花括号来分割代码块。 (注:不要混合使用tab键和空格 ...
分类:
编程语言 时间:
2016-05-16 19:59:45
阅读次数:
360
流程控制ifif语句ifexpression:statement(s)elseelse语句:if语句,else语句ifexpression:statement(s)else:statement(s)elif语句:ifexpression1:statement1(s)elifexpression2(s):statements2(s)else:statement2(s)注:Python使用缩进作为其语法分组的方法,建议使用4个空格逻..
分类:
编程语言 时间:
2016-05-15 20:02:09
阅读次数:
198
字典 dictionary Python 使用 {} 或者 dict() 来创建一个空的字典: a = {} a = dict()type(a) dict a = {} a = dict()type(a) dict a = {} a = dict()type(a) dict a = {} a = d ...
分类:
编程语言 时间:
2016-05-15 18:18:19
阅读次数:
239
使用input和raw_input都可以读取控制台的输入,input()只能接受int,float或由它们组成的表达式: input和raw_input在处理数字时是有区别的: 1.输入为纯数字时input返回的是数值类型,如int,floatraw_inpout返回的是字符串类型,string类型 ...
分类:
编程语言 时间:
2016-05-15 10:49:20
阅读次数:
168
前言:来到新公司,领导下发了个需求:每周需要对服务器进行一个巡检,以及分析ngxin趋势,由于公司实际生产环境服务器不是特别多,考虑暂时先用脚本完成该需求。大致思路:收集数据->写入excel制成图表->发邮件一、收集nginx数据主要是对nginxlog进行一个分析,统计数据..
分类:
编程语言 时间:
2016-05-13 17:26:51
阅读次数:
867
问题1:pip 报错 C:\Users\Administrator>pip3 install pyreadline Fatal error in launcher: Unable to create process using '"' 解决: python -m pip install packag ...
分类:
编程语言 时间:
2016-05-13 09:31:26
阅读次数:
140
简单的数学运算 整数相加,得到整数: 浮点数相加,得到浮点数: 整数和浮点数相加,得到浮点数: 变量赋值 Python使用<变量名>=<表达式>的方式对变量进行赋值 左边变量名,右边表达式,不可调换位置。 字符串 String 字符串的生成,需要用单引号或双引号(引号必须成对出现,否则会出错): 字 ...
分类:
编程语言 时间:
2016-05-11 11:15:35
阅读次数:
227