随笔分类 -  java 爬虫

Httpclient 表单,json,multipart/form-data 提交 ---总结常用的方法
摘要:最近在项目中,一直在使用HttpClient 中的方法,这里我进行一些方法的汇总,也是结合了一些大牛写的代码,以备不时之需 官话:HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 阅读全文
posted @ 2018-09-05 22:34 iscys 阅读(16406) 评论(0) 推荐(0)
java正则表达式(regular)
摘要:哎呀妈呀,脑瓜疼 正则表达式 正则是用来处理复杂文本类型的 标准字符集合: 自定义字符集合(***) 量词使用:修饰匹配次数的特殊符号 字符边界:是位置,不是字符 手机号码匹配 邮箱匹配 常用的正则匹配 java 使用正则: 使用到 java.util包下的 Pattern 创建正则表达式 以及Ma 阅读全文
posted @ 2018-09-02 22:19 iscys 阅读(284) 评论(0) 推荐(0)
java 爬虫
摘要:由于项目需求,综合了几种考虑方案,准备使用java 爬虫进行数据的获取,不用自己去费劲的想逻辑的实现 使用java爬虫之前,我们必须要掌握的知识: 1. 对前端HTML的元素有一定的认识 2. 使用httpclient 3. jsoup 工具进行HTML的解析判断 4. 能够使用一款网络抓包工具 抓 阅读全文
posted @ 2018-09-02 11:52 iscys 阅读(561) 评论(0) 推荐(0)
HttpClient--使用HttpClient进行Get Post请求访问
摘要:在java后台开发中,我们有时候需要调用其他网站的接口进行数据的获取操作,我们一般会采用 1.java net 包中的URL 类,进行网络的数据获取 2.使用apache提供的HttpClient进行网络中数据的获取; 这里我们使用第二种方式,使用apache 提供的HttpClient进行数据的获 阅读全文
posted @ 2018-08-19 20:57 iscys 阅读(922) 评论(0) 推荐(0)