摘要: 问题 当爬取 linovelib 上的小说正文时,发现提取出来的内容中存在无法正常显示的乱码字符,如下所示: 注:上述内容来源 这里 猜测 猜测一:解析时使用的字符编码与源网址不一致; 猜测二:乱码字符为该文件内专属的字符,即猜测该网址使用了字体防爬; 猜测三:网站内的js脚本对正文内容进行了再次加 阅读全文
posted @ 2023-03-27 17:40 Garbler 阅读(487) 评论(0) 推荐(0)