Fork me on GitHub

爬虫-处理html的转义字符

爬到的书店的名称里面有如下情况:

这是HTML转义字符的原因导致的,

如下:

解决方法

方法一-----------------------采用正则---如下,有问题,这样变成一个一个字符了,还要进行拼接处理

方法二--------------------使用html模块里面的方法-html.unescape()

欧克

 

posted @ 2018-06-28 15:39  TaoTao~  阅读(1067)  评论(0)    收藏  举报