摘要: 先import进来 以抓取csdn首页为例,代码如下: 阅读全文
posted @ 2021-04-07 21:34 挖掘机斯基 阅读(55) 评论(0) 推荐(0)
摘要: Robots协议: Robots Exclusion Standard(网络爬虫排除标准) 作用: 网站告知可以爬取的页面,不能爬取的页面 位置: 网站根目录下的robots.txt文件中 查看: 在地址栏中输入/robo... 阅读全文
posted @ 2021-04-07 20:15 挖掘机斯基 阅读(688) 评论(0) 推荐(0)