html编码与解码
在对网页内容进行操作时,可能会遇到编码与解码的问题,如网页中的内容:
return confirmSelect('风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100');
怎样才能方便地把 ' 这种 html 编码替换掉呢?
python 中的 html 模块提供了相应的函数,
import html text = ''风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100''; out = html.unescape(text)) # 返回 '风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100' out2 = html.escape(out) # 返回 '风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100'
aLine = html.unescape(aLine)
首先import html,引用这个模块。

浙公网安备 33010602011771号