Python3 urllib.parse 常用函数示例

时间：2018-12-06 23:23:30 阅读：187 评论：0 收藏：0 [点我收藏+]

标签：获取url参数解码 main url http 一个 targe pat proxy

Python3 urllib.parse 常用函数示例

http://blog.51cto.com/walkerqt/1766670

1、获取url参数。

>>> from urllib import parse
>>> url = r‘https://docs.python.org/3.5/search.html?q=parse&check_keywords=yes&area=default‘
>>> parseResult = parse.urlparse(url)
>>> parseResult
ParseResult(scheme=‘https‘, netloc=‘docs.python.org‘, path=‘/3.5/search.html‘, params=‘‘, query=‘q=parse&check_keywords=yes&area=default‘, fragment=‘‘)
>>> param_dict = parse.parse_qs(parseResult.query)
>>> param_dict
{‘q‘: [‘parse‘], ‘check_keywords‘: [‘yes‘], ‘area‘: [‘default‘]}
>>> q = param_dict[‘q‘][0]
>>> q
‘parse‘
#注意：加号会被解码，可能有时并不是我们想要的
>>> parse.parse_qs(‘proxy=183.222.102.178:8080&task=XXXXX|5-3+2‘)
{‘proxy‘: [‘183.222.102.178:8080‘], ‘task‘: [‘XXXXX|5-3 2‘]}

2、parse_qs/parse_qsl

>>> from urllib import parse
>>> parse.parse_qs(‘action=addblog&job=modify&tid=1766670‘)
{‘tid‘: [‘1766670‘], ‘action‘: [‘addblog‘], ‘job‘: [‘modify‘]} #注意和第三个并不一样
>>> parse.parse_qsl(‘action=addblog&job=modify&tid=1766670‘)
[(‘action‘, ‘addblog‘), (‘job‘, ‘modify‘), (‘tid‘, ‘1766670‘)]
>>> dict(parse.parse_qsl(‘action=addblog&job=modify&tid=1766670‘)) #注意和第一个并不一样
{‘tid‘: ‘1766670‘, ‘action‘: ‘addblog‘, ‘job‘: ‘modify‘}

3、urlencode

>>> from urllib import parse
>>> query = {
	‘name‘: ‘walker‘,
	‘age‘: 99,
	}
>>> parse.urlencode(query)
‘name=walker&age=99‘

4、quote/quote_plus

>>> from urllib import parse
>>> parse.quote(‘a&b/c‘)    #未编码斜线
‘a%26b/c‘
>>> parse.quote_plus(‘a&b/c‘)    #编码了斜线
‘a%26b%2Fc‘

5、unquote/unquote_plus

from urllib import parse
>>> parse.unquote(‘1+2‘)    #不解码加号
‘1+2‘
>>> parse.unquote(‘1+2‘)    #把加号解码为空格
‘1 2‘

　　如果你还想问为什么没有urldecode——再把示例1看五遍。^_^

6、域名编码避免敏感词屏蔽。

>>> ‘‘.join(‘%‘ + (‘%x‘%ord(ch)).upper() for ch in ‘github.com‘)
‘%67%69%74%68%75%62%2E%63%6F%6D‘

2、Binary-to-text encoding （各种base编码。base58、base64等）

3、Requests：为人类设计的HTTP库

*** walker ***

Python3 urllib.parse 常用函数示例

标签：获取url参数解码 main url http 一个 targe pat proxy

原文地址：https://www.cnblogs.com/hanbowen/p/10080192.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行