随笔分类 -  HttpClient

摘要:1.maven依赖 2.代码实现 阅读全文
posted @ 2017-09-17 17:25 小葱拌豆腐~ 阅读(1853) 评论(0) 推荐(0)
摘要:1.代理IP的用处: 在爬取网页的时候,有的目标站点有反爬虫机制,对于频繁访问站点以及规则性访问站点的行为,会采集屏蔽IP措施。这时候,就可以使用代理IP,屏蔽一个就换一个IP。 2.代理IP分类: 代理IP的话 也分几种: 透明代理、匿名代理、混淆代理、高匿代理,一般使用高匿代理。 3.使用 Re 阅读全文
posted @ 2017-09-13 23:02 小葱拌豆腐~ 阅读(450) 评论(0) 推荐(0)
摘要:使用HttpClient抓取图片,先通过 entity.getContent() 获取输入流,然后 使用 common io 中的文件复制 方法 将图片专区到本地,代码如下: 1.需要依赖common io包 2.Java代码: 3、HttpClient学习地址 开源博客系统-HttpClient 阅读全文
posted @ 2017-09-12 22:59 小葱拌豆腐~ 阅读(1301) 评论(0) 推荐(0)
摘要:一、设置请求头消息 User-Agent模拟浏览器 1.当使用第一节的代码 来 访问推酷的时候,会返回给我们如下信息: 这是因为网站做了限制,限制别人爬。解决方式可以设置请求头消息 User-Agent模拟浏览器。代码如下: 给HttpGet方法设置头消息,即可模拟浏览器访问。 二、获取响应内容Co 阅读全文
posted @ 2017-09-11 23:11 小葱拌豆腐~ 阅读(2659) 评论(0) 推荐(1)
摘要:一、简介 HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。详细介绍,此处基于4.5.2版本。maven依赖: 二、HelloWorld实现 上述代 阅读全文
posted @ 2017-09-11 22:56 小葱拌豆腐~ 阅读(302) 评论(0) 推荐(0)