Python3的urllib.parse常用函数小结

作者: 有趣的恶魔QAQ | 来源:发表于2019-10-30 15:35 被阅读0次

Python3的urllib.parse常用函数小结
urlparse解析url
02-Python3的基础语法
Python学习
python3内置函数（1）
Python 69个内置函数分8类总结
常用函数小结（一）
python3 range() 函数和 xrange() 函数
Python学习网站推荐 [ 搬砖 ]
自定义函数, 持续更新

一、获取url参数

①解析url（urlparse）

from urllib import parse
url = 'http://ccforever/get_page?page=1&index=1'
b = parse.urlparse(url)
print(b)
结果为：
ParseResult(scheme='http', netloc='ccforever', path='/get_page', params='', query='page=1&index=1', fragment='')

②获取query参数（parse_qs）

a.直接获取query
print(b.query)
结果为：
page=1&index=1
==================================================================================
b.解析query参数
c = parse.parse_qs(b.query)
print(c)
结果为：
{'page': ['1'], 'index': ['1']}
==================================================================================
注意：当query参数中有 ‘ + ’ 的时候，会被解码，并不是我们想要的
例：
d = parse.parse_qs('page=7464ssfa18f46+78dasf&index=2')
print(d)
结果为：
{'page': ['7464ssfa18f46 78dasf'], 'index': ['2']}

二、编码成url参数（urlencode）

from urllib import parse
url_dict = {
    'name': 'AlanWalker',
    'page': 1,
    'index': 1
}
f = urllib.parse.urlencode(url_dict)
print(f)
结果为：
name=AlanWalker&page=1&index=1

注意：此函数会将空格自动编码成 ‘+’号

from urllib import parse
url_dict = {
    'name': 'Alan Walker',     此处中间多了空格
    'page': 1,
    'index': 1
}
f = urllib.parse.urlencode(url_dict)
print(f)
结果为：
name=Alan+Walker&page=1&index=1    结果处中间的空格变成了‘+’

三、（编码）quote/quote_plus

①quote

from urllib import parse
url = 'http://ccforever/get_page++?*-&%$#@!'
g = parse.quote(url)
print(g)

结果为：
http%3A//ccforever/get_page%2B%2B%3F%2A-%26%25%24%23%40%21 编码除斜线 ‘/’外所有符号

②quote_plus

from urllib import parse
url = 'http://ccforever/get_page++?*-&%$#@!'
g = parse.quote_plus(url)
print(g)

结果为：
http%3A%2F%2Fccforever%2Fget_page%2B%2B%3F%2A-%26%25%24%23%40%21 编码包括斜线 ‘/’的所有符号

四、（解码）unquote/unquote_plus

①unquote

from urllib import parse
url = 'http://ccforever/get_page++?'
g = parse.unquote(url)
print(g)

结果为：
http://ccforever/get_page++? 此处未解码 ‘+’号

②unquote_plus

from urllib import parse
url = 'http://ccforever/get_page++?'
g = parse.unquote_plus(url)
print(g)

结果为：
http://ccforever/get_page ? 此处将 ‘+’号解码为空格

网友评论

本文标题：Python3的urllib.parse常用函数小结

本文链接：https://www.haomeiwen.com/subject/aymovctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！