摘要:最近用 scrapy 爬某网站,发现拿到的内容里面含有 \xa0 、 \u3000 这样的字符,起初还以为是编码不对,搜了一下才知道是见识太少 233 。 \xa0 是不间断空白符 我们通常所用的空格是 \x20 ,是在[标准ASCII][A1]可见字符 0x20~0x7e 范围内。 而 \xa0 阅读全文
posted @ 2017-02-01 20:43 BlackStorm 阅读 (29207) 评论 (0) 编辑