该文被密码保护。 阅读全文
posted @ 2020-02-26 17:44
ytkah
阅读(0)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2020-02-26 09:47
ytkah
阅读(0)
评论(0)
推荐(0)
摘要:
最近在学习一些python爬虫,我们要爬取一个站点,首先要去查看网站的robots协议,如果明确禁止抓取了要遵守,否则可能会带来麻烦。第二步我们要知道网站是用什么技术做的,如何通过python的方法来识别呢?可以用builtwith库来实现(注意是builtwith不是buildwith),当然前提 阅读全文
posted @ 2020-02-26 09:19
ytkah
阅读(519)
评论(0)
推荐(0)

浙公网安备 33010602011771号