会员
周边
新闻
博问
融资
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
懒惰的小松鼠
博客园
首页
新随笔
联系
订阅
管理
第九节:web爬虫之urllib(五)
第四个模块 robotparser:
主要是用来识别网站的 robots.txt 文件,然后判断哪些网站可以爬,哪些网站不可以爬的,其实用的比较少。
posted @
2019-03-16 12:25
懒惰的小松鼠
阅读(
94
) 评论(
0
)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面
返回顶部
公告