1 url分解
import urllib.parse
2
3 result = urllib.parse.urlparse('http://www.baidu.com')
4 print(result)
5 结果为:ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='', fragment='')
6 #urllib.parse.urlparse将传入的url解析成了六大部分,是一个元组,含协议名称、域名、路径等
1 #url组合
2 #urllib.parse.urlunparse将路径组合成url
3 import urllib.parse
4 data =['http','www.baidu.com','index.html','user','a=6','comment']
5 url = urllib.parse.urlunparse(data)
6 print(url)
7
8 #urljoin组合
9 #后面会覆盖前面,如果没有对应的,则会把前面的保留
10 url = urllib.parse.urljoin('http://www.baidu.com','https://baidu.com.index.html')
11 print(url)
1 #urlencode将字典编程请求的参数
2 #需要post一些数据待处理时,通常用字典的形式封装起来交给urlencode处理
3 import urllib.parse
4 data={
5 'name':'germy',
6 'age':'22'
7 }
8
9 data = urllib.parse.urlencode(data)
10 url = 'http://www.baidu.com?'+ data
11 print(url)
12 #结果为:http://www.baidu.com?name=germy&age=22