会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
微风伏面
首页
管理
2017年12月6日
python 正则空格\xa0实录 与xpath取 div 里面的含多个标签的所有文字
摘要: 业余玩爬虫时,由原先的原生写法 改为 scrapy框架了,使用自带的selector时,xpath配合正则来抓取回复数和阅读数的时候,遇到的小问题,mark下。 首先获取到 我需要的数据块,(我用scrapy shell调试的) 对应的html文档是: 关于 这个 空格  被爬成了\xa0的
阅读全文
posted @ 2017-12-06 10:18 fredgui
阅读(3400)
评论(0)
推荐(0)
公告