摘要: 近日在构想一个采集器的小程序主要是用来采集文章的由于文章图片都有防盗链的措施不得不采用一些手段(不想下载到本地暂时)这里在对html的解析上没有什么好的解决方法百度了一下发现两个html解析类这里发出来推荐一下先上个国人的:JumonyJumony是开源项目,目前源代码存放在GitHub ,源码地址... 阅读全文
posted @ 2015-11-21 20:51 吾之初心,永世不忘 阅读(244) 评论(0) 推荐(0)
摘要: 群:340569308 在做一个采集器的时候 只做了文章的html代码的采集 没有对图片进行处理(穷逼买不起高能服务器%>_<%) 发现采集来的文章图片显示不出来 是的就是这个鸟样 目前想到的解决方案有两个 一:自建图片解析页面动态返回图片 二:更改浏览器端图片请求的header数据(更改refer 阅读全文
posted @ 2015-11-21 15:56 吾之初心,永世不忘 阅读(8652) 评论(22) 推荐(2)