python3.+ 爬虫教程(一)html源码获取

import urllib

url = 'https://www.baidu.com'
content=urllib.request.urlopen(url).read() # content类型为bytes,汉字以16进制显示
print(content.decode('utf-8')) # 可以正常显示汉字

 

posted @ 2020-07-21 16:10  牛郎  阅读(267)  评论(0编辑  收藏  举报