会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
博客园
首页
新随笔
联系
订阅
管理
2020年11月20日
xpath+requests+peewee——CSDN论坛全方位爬虫
摘要: 这周接到任务,要爬取CSDN论坛的各种信息,解析URL的时间花了很久,还改了好多乱七八糟的BUG。csdn的页面也有问题,比如可以转到帖子的下一页,但是页面为空;以及用户页面404等等。林林总总改了许多,代码如下。 有些调试的时候注释掉的代码,大家看看就行,懒得再改了哈哈哈 首先是用peewee建立
阅读全文
posted @ 2020-11-20 17:00 Mangnolia
阅读(193)
评论(0)
推荐(1)
编辑
公告