摘要: cheerio DOM化并解析的时候 1.假如使用了 .text()方法,则一般不会有html实体编码的问题出现 2.如果使用了 .html()方法,则很多情况下(多数是非英文的时候)都会出现,这时,可能就需要转义一番了 类似这些 因为需要作数据存储,所有需要转换 Халк крушит. Новы 阅读全文
posted @ 2015-07-01 18:50 -渔人码头- 阅读(2128) 评论(1) 推荐(0)
摘要: 一、非UTF-8页面处理 1.背景 windows-1251编码 比如俄语网站:https://vk.com/cciinniikk 可耻地发现是这种编码 所有这里主要说的是 Windows-1251(cp1251)编码与utf-8编码的问题,其他的如 gbk就先不考虑在内了~ 2.解决方案 1. 使 阅读全文
posted @ 2015-07-01 18:19 -渔人码头- 阅读(4976) 评论(2) 推荐(2)