html编码与解码

在对网页内容进行操作时，可能会遇到编码与解码的问题，如网页中的内容：

return confirmSelect(&#39;风清扬&#39;,&#39;金融风险管理&#39;,&#39;1&#39;,false,&#39;0&#39;,&#39;BKC02533750AT0005368&#39;,true,&#39;100&#39;);

怎样才能方便地把 ' 这种 html 编码替换掉呢？

python 中的 html 模块提供了相应的函数，

import html

text = '&#39;风清扬&#39;,&#39;金融风险管理&#39;,&#39;1&#39;,false,&#39;0&#39;,&#39;BKC02533750AT0005368&#39;,true,&#39;100&#39';

out = html.unescape(text))
# 返回 '风清扬','金融风险管理','1',false,'0','BKC02533750AT0005368',true,'100'

out2 = html.escape(out)
# 返回 &#x27;风清扬&#x27;,&#x27;金融风险管理&#x27;,&#x27;1&#x27;,false,&#x27;0&#x27;,&#x27;BKC02533750AT0005368&#x27;,true,&#x27;100&#x27;

aLine = html.unescape(aLine)

首先import html，引用这个模块。

posted @ 2019-09-15 18:34 汉学阅读(441) 评论(0) 收藏举报

刷新页面返回顶部

汉学

html编码与解码

公告