摘要: 最近学习主题模型pLSA、LDA,就想拿来试试中文。首先就是找文本进行切词、去停用词等预处理,这里我找了开源工具IKAnalyzer2012,下载地址:(:(注意:这里尽量下载最新版本,我这里用的IKAnalyzer2012.zip 这本版本后来测试时发现bug,这里建议IKAnalyzer2012 阅读全文
posted @ 2019-04-15 17:27 星朝 阅读(927) 评论(0) 推荐(0)
摘要:     它在哪里呢?   非常重要! [hadoop@HadoopMaster custom]$ pwd/home/hadoop/app/elasticsearch 2.4.3/plugins/ik/config/custom[hadoop@HadoopMaster c 阅读全文
posted @ 2019-04-15 17:25 星朝 阅读(1254) 评论(0) 推荐(0)
摘要: Java高级别REST客户端(The Java High Level REST Client)以后简称高级客户端,内部仍然是基于低级客户端。它提供了更多的API,接受请求对象作为参数并返回响应对象,由客户端自己处理编码和解码。 每个API都可以同步或异步调用。 同步方法返回一个响应对象,而异步方法的 阅读全文
posted @ 2019-04-15 14:30 星朝 阅读(1113) 评论(0) 推荐(0)