会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Riy
博客园
首页
新随笔
联系
订阅
管理
02 2020 档案
python爬取某站新闻,并分析最近新闻关键词
摘要:在爬取某站时并做简单分析时,遇到如下问题和大家分享,避免犯错: 一丶网站的path为 /info/1013/13930.htm ,其中13930为不同新闻的 ID 值,但是这个数虽然为升序,但是没有任何规律的升序。 解决办法: 使用 range 顺序爬取,错误的网站在页面会报如图错误: 这时我们首先
阅读全文
posted @
2020-02-27 13:27
riyir
阅读(4473)
评论(0)
推荐(0)
公告