02 2020 档案
摘要:要求:查询出emp表中1981年2月份入职的员工 emp表 常用的两种方式: 1.YEAR查询年,MONTH查询月 SELECT * FROM emp WHERE YEAR(HIREDATE)='1981' AND MONTH(HIREDATE)='2' 2.date_format (使用更多) S
阅读全文
摘要:不需要再注册表里添加什么~ 1. 首先,安装一个 EditPlus 软件,当然,百分之九十的可能你的不是zb的,不然你也不会来这了。 2. 右键 EditPlus -> 一管理员身份运行(一定要管理员) 3. 如果不以管理员身份就会报错,这个设置的执行应该还是编辑注册表 完成 !
阅读全文
摘要:之前的博客搜索栏用的是 sql 模糊查询进行查找,最近学完lucene,要学以致用啊,就把sql搜索给替换下来吧 中间遇到一些问题,也是学过程中没有提到的,所以说,还是实践出真知啊。 lucene分开来讲的话,我感觉就是两大块:索引维护、搜索索引 索引维护包括:添加索引、删除索引、更新索引 publ
阅读全文
摘要:业务分析 获取 www.51.job.com 上的招聘信息。只爬取“计算机软件”和“互联网电子商务”两个行业的信息。 1. 查询页面,获取查询到列表的中的url 2. 跳转到相应页面,获取需要的数据 存储数据 创建数据库,创建存储对应数据的表 实现流程 开始 —— > 列表页面 —— > 获取url
阅读全文
摘要:在我们抓取到页面之后,还需要对页面进行解析。整个页面都是字符串的形式,可以使用字符串处理工具来解析页面,也可以使用正则表达式,但这些方法都会带来很大的开发成本。所以我们需要一款准们解析 html 页面的工具。 Jsoup jsoup是一款 java 的 HTML 解析器,可直接解析某个URL地址、H
阅读全文
摘要:get请求 get请求的基本使用 // 1. 打开浏览器,创建HttpClient对象 CloseableHttpClient httpClient = HttpClients.createDefault(); // 2.输入网址,发起get请求创建HttpGet对象 HttpGet get = n
阅读全文
摘要:首先,也是最重要的一点,你得有 IKAnalyzer 这个jar包 https://pan.baidu.com/s/1bw_pxleG5SCghMSRKNL97A 提取码:ywtg 获得以下文件: 构建项目(普通项目或maven,我这里使用了maven项目) 0.导入lucene依赖 <!-- 添加
阅读全文
摘要:WebMagic WebMagic是一款爬虫框架,其底层用到之前学习到的HttpClient 和 Jsoup ,可以让我们更方便的开发爬虫。 WebMagic 项目代码分为核心和扩展两部分 - 核心部分是一个精简的、模块化的爬虫实现; - 扩展部分则包括一些便利的、实用性强的功能。
阅读全文

浙公网安备 33010602011771号