001第一个爬虫程序
重新编写第一个爬虫程序,开始记录自己的爬虫之旅,一定会很精彩。下面请参见第一个代码,爬取百度的源代码然后保存到一个文档中。大家可能会想这样做有什么意义呢?
其实你将百度的源代码弄下来只是第一步,第二步你可以修改这个源代码然后做出属于自己的搜索主页,比如可以修改百度页面上面所有的文字,也可以将背景换成照片,添加音乐,加个宠物等,后面有机会慢慢给大家分享。
from urllib.request import urlopen
url = "http://www.baidu.com"
resp = urlopen(url)
with open("baidu.html", mode="w", encoding="utf-8") as f:
f.write(resp.read().decode("utf-8"))
浙公网安备 33010602011771号