会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
xwwer
记python爬取课表和爬取新闻网站时遇到的一些坑点
一,爬取课表
fzu教务处的登陆步骤是要经过两次重定向,看起来麻烦爬起来其实并不复杂,用requests爬取的时候遇到坑点是页面来源错误,页面来源信息是放在请求头中的,将header['referer'] 设置为上一级的url链接就可以解决了
爬取表格信息可以直接用pandas来爬取简洁美观
二,爬取fd要闻
这个做得相对顺利,有个小坑点,就是过几天就2021了,注意这个可能引发的bug
posted on
2020-12-26 23:32
xwwer
阅读(
111
) 评论(
0
)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面
返回顶部
导航
博客园
首页
联系
订阅
管理
公告