python3.+ 爬虫教程(一)html源码获取
import urllib
url = 'https://www.baidu.com'
content=urllib.request.urlopen(url).read() # content类型为bytes,汉字以16进制显示
print(content.decode('utf-8')) # 可以正常显示汉字
import urllib
url = 'https://www.baidu.com'
content=urllib.request.urlopen(url).read() # content类型为bytes,汉字以16进制显示
print(content.decode('utf-8')) # 可以正常显示汉字