会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
英雄莫问出处,富贵当思缘由
博客园
首页
新随笔
联系
订阅
管理
2018年3月20日
Python 爬虫 使用正则去掉不想要的网页元素
摘要: 在做爬虫的时候,我们总是不想去看到网页的注释,或者是网页的一些其他元素,有没有好的办法去掉他们呢? 例如:下面的问题 针对这三种情况,可以试用正则 sub去提取信息 运行结果是:
阅读全文
posted @ 2018-03-20 15:20 淋哥
阅读(1529)
评论(0)
推荐(0)
公告