随笔分类 - java
使用java过程中遇到的坑
摘要:1.Hit 类 这个类只包含几个状态位,用于判断匹配的类型。 结构很简单 主要是几个常量: 同时还有词段的开始和结束为止 补充一个DictSegment类的对象,存储词典匹配过程中,当前匹配到的词典分支节点 暴露出来的公共方法 isMatch判断是否完全匹配 isPrefix判断是否是词的前缀 is
阅读全文
摘要:废话不多说直接上代码 记得加上依赖
阅读全文
摘要:在Filter中读取inputSeream读取一次之后就无法再次读取,解决办法如下: 调用如下 工具类如下
阅读全文
摘要:环境: Cloudera Express 5.12.1 JDK 1.8.0_92 CentOS 7 步骤1:数据导入到Hbase中(非正题,跳过) hbase中表为allDoc,两个Family:fulltext,fileInfo fulltext中就一列:fulltext fileInfo中有如下
阅读全文
摘要:例子很简单 Exchanger可以理解为消息队列或者说是一个通信管道,从一边拿到消息,另外一边进行消费。 不过这个是同步实现的,消费者在exchange之前,生产者一直处于等待状态,而不是一直生产。 代码如下:
阅读全文
摘要:对比 使用CyclicBarrier 上次用Barrier方式实现了线程等待一组完成,这次用CountDownLatch来实现 我的理解CountDownLatch 采用的方式是计数器方式,每执行完一个线程,计数器减一,等计数器减到0的时候,之前等待的线程就可以执行了。 和Barrier的例子一样,
阅读全文
摘要:示例很简单,具体CyclicBarrier是如何实现的,后面在慢慢研究。 输出结果不固定如下所示:
阅读全文
摘要:试了一堆插件,最后用的还是 publish over SSH jenkins基本配置不多说了,就是配置一下git仓储,配置一下gradle执行命令 之后执行Send build artifacts over SSH 提前配置好对应的服务器 Send build artifacts over SSH
阅读全文
摘要:使用的是IDEA,直接引入 放在build.gradle的最上面,然后执行shadowJar即可。 网上说有一种方法 这种方法确实打入进去了,但是运行的时候报错,异常如下: 不知道什么原因,不过用第三方插件暂时可以解决,原因慢慢排查了。 另外还有一种方法可以运行,不过依赖单独放入一个lib目录下,也
阅读全文
摘要:C#标准是首字母大写,Java规范是首字母小写,在序列化成Json之后,反序列化会出现反序列化失败的问题。。 从C#反序列化成JavaBean的时候通过如下注解可以直接解决该问题 将该注解放到对应的class上,即可从大写首字母的Json串,反序列化成JavaBean。
阅读全文
摘要:学习Hadoop 实现TF-IDF 算法,使用的是CDH5.13.1 VM版本,Hadoop用的是2.6.0的jar包,Maven中增加如下即可 代码如下: 整体实现算是比较简单,第一个MR计算idf,map是统计每个文档出现过的词,都记成1次,然后reducer统计所有的,这样就得到了每一个词的i
阅读全文
摘要:在IDE下调试怎么也没有发现问题,但是部署到服务器上,提示找不到资源,找了半天资料总算是找到了原因: Jar包中的资源加载不能使用File方式,只能使用InputStream方式读取。知道原因就好解决了,如下: 网上教程有一种说法用ResourceUtils的extractJarFileURL方法可
阅读全文

浙公网安备 33010602011771号