html编码与解码

在对网页内容进行操作时,可能会遇到编码与解码的问题,如网页中的内容:

return confirmSelect('风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100');

怎样才能方便地把 ' 这种 html 编码替换掉呢?

python 中的 html 模块提供了相应的函数,

import html

text = ''风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100&#39';

out = html.unescape(text))
# 返回 '风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100'

out2 = html.escape(out)
# 返回 '风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100'

 

 

aLine = html.unescape(aLine)

首先import html,引用这个模块。

posted @ 2019-09-15 18:34  汉学  阅读(439)  评论(0)    收藏  举报