标签:进程 alt div ges 字符串 迭代器 技术分享 需要 返回
正则的贪婪匹配
非贪婪模式按照最小重复数取
非贪婪匹配
正则的方法
re.split 正则分割
分割次数
保留分隔符,用一个括号套住分隔符
sub 替换字符串
需要三个参数,要替换的内容(正则),新内容,字符串
分开写用compile
可以写一次规则
然后多次匹配,好处就是方便灵活。
返回一个迭代器对象
爬虫爬豆瓣电影信息,用正则
模块 configparser
功能:创建成下面类型的文件
使用方法
读操作
DEFAULT是默认信息,不需要打印,默认信息是所有段落信息的共享信息。
用上图方法判断字段是否在文件内
如上图取值,取出文件内的内容,字典里的字典的键
subprocess模块
调用的时候新生成一个进程
linux环境不需要加shell=True,除非命令是个组合命令
标签:进程 alt div ges 字符串 迭代器 技术分享 需要 返回
原文地址:http://www.cnblogs.com/zitao1/p/7118877.html