美文网首页
关于urllib.parse

关于urllib.parse

作者: 想旅游的程序员 | 来源:发表于2018-10-30 19:52 被阅读0次

原文地址:https://blog.csdn.net/zly412934578/article/details/77776659

This module defines a standard interface to break Uniform Resource Locator (URL) strings up in components (addressing scheme, network location, path etc.), to combine the components back into a URL string, and to convert a “relative URL” to an absolute URL given a “base URL.”


以上是官方API上对这个模块的解释:这个模块是一个能URL字符串拆分成组件,能把组件合并成URL和将一个相对的URL转成一个抽象的URL,从而得到一个基本的URL标准格式。
支持的URL格式file、ftp、gopher、hdl、http、https、imap、mailto,mms、news、nntp、prospero、rsync、rtsp、rtspu、sftp、shttp、sip、sips、snews、svn、svn+ssh、telnet、wais、ws、wss

URL parsing(URL解析)

URL parsing函数注重将URL字符串分号才能组件,或者将组件合并成一个URL
urllib.parse.urlparse(urlstring,scheme='',allow_fragments=True)包含六个部分,元组中每一个元素都是一个字符串,可以为空,这六个部分均不能再被分割成更小的部分。

image.png
例如:
import urllib.parse
 
print(urllib.parse.urlparse("https://www.zhihu.com/question/50056807/answer/223566912"))

结果

ParseResult(scheme='https', netloc='www.zhihu.com', path='/question/50056807/answer/223566912', params='', query='', fragment='')

urllib.parse.urlunparsre(parts)

这个函数可以将urlparse()分解出来的元组组装成URL

实例:

import urllib.parse
# print(urllib.parse.parse_qsl("FuncNo=9009001&username=1"))
parsed=urllib.parse.urlparse("https://www.zhihu.com/question/50056807/answer/223566912")
print(parsed)
# print(urllib.parse.parse_qs("https://www.zhihu.com/question/50056807/answer/223566912"))
# print(urllib.parse.parse_qs("FuncNo=9009001&username=1"))
t=parsed[:]
print(urllib.parse.urlunparse(t))

输出结果:

ParseResult(scheme='https', netloc='www.zhihu.com', path='/question/50056807/answer/223566912', params='', query='', fragment='')
https://www.zhihu.com/question/50056807/answer/223566912

相关文章

网友评论

      本文标题:关于urllib.parse

      本文链接:https://www.haomeiwen.com/subject/lskntqtx.html