一句很装逼的话, The Website is the API.. (网站就是api)
把网站当成api,当成获取数据的接口
利用Requests库
注意robots.txt
Beautiful Soup库解析信息内容
Re库正则表达式
爬虫框架Scrapy
课程目的:掌握定向网络数据爬取和网页解析的基本能力
next