当前位置: 首页 > 工具软件 > parse5 > 使用案例 >

urllib.parse模块

谭泉
2023-12-01

urllib.parse模块

python中提供urllib.parse模块用来编码和解码,分别是urlencode()unquote()

  • 编码urlencode()
# 导入parse模块
from urllib import parse

#调用parse模块的urlencode()进行编码
query_string = {'wd':'爬虫'}
result = parse.urlencode(query_string)

# format函数格式化字符串,进行url拼接
url = 'http://www.baidu.com/s?{}'.format(result)
print(url)

对url地址的编码操作

  • 编码quote(string)
from urllib import parse

url = "http://www.baidu.com/s?wd={}"
words = input('请输入内容')

#quote()只能对字符串进行编码
query_string = parse.quote(words)
url = url.format(query_string)
print(url)

quote()只能对字符串编码,而urlencode()可以对查询字符串进行编码。

  • 解码unquote(string)
from urllib import parse
string = '%E7%88%AC%E8%99%AB'
result = parse.unquote(string)
print(result)

解码就是对编码后的url进行还原

URL地址拼接方式

  • 字符串相加

     query1= 'http://www.baidu.com/s?'
     query2='wd=%E7%88%AC%E8%99%AB'
     url = query1 + query2
    
  • 字符串格式化

  query2='wd=%E7%88%AC%E8%99%AB'
  url = 'http://www.baidu.com/s?%s'% query2
  • format()
# 导入parse模块
from urllib import parse

#调用parse模块的urlencode()进行编码
query_string = {'wd':'爬虫'}
result = parse.urlencode(query_string)

# format函数格式化字符串,进行url拼接
url = 'http://www.baidu.com/s?{}'.format(result)
print(url)

 类似资料: