searchDM - 博客园

2021年4月18日

摘要： 5.1 Spring Data 框架集成5.1.1 Spring Data 框架介绍 Spring Data 是一个用于简化数据库、非关系型数据库、索引库访问，并支持云服务的开源框架。其主要目标是使得对数据的访问变得方便快捷，并支持 map-reduce 框架和云计算数据服务。 Spring Dat 阅读全文

posted @ 2021-04-18 14:24 searchDM 阅读(133) 评论(0) 推荐(0) 编辑

Elasticsearch 环境

摘要： 3.1 相关概念 3.1.1 单机 & 集群单台 Elasticsearch 服务器提供服务，往往都有最大的负载能力，超过这个阈值，服务器性能就会大大降低甚至不可用，所以生产环境中，一般都是运行在指定服务器集群中。除了负载能力，单点服务器也存在其他问题：单台机器存储容量有限单服务器容易出现单阅读全文

posted @ 2021-04-18 12:08 searchDM 阅读(66) 评论(0) 推荐(0) 编辑

Elasticsearch 优化

摘要： 6.1 硬件选择 Elasticsearch 的基础是 Lucene，所有的索引和文档数据是存储在本地的磁盘中，具体的路径可在 ES 的配置文件../config/elasticsearch.yml 中配置，如下： # Paths # # Path to directory where to sto 阅读全文

posted @ 2021-04-18 11:10 searchDM 阅读(237) 评论(0) 推荐(0) 编辑

2021年4月17日

Elasticsearch入门

摘要： 2.1 Elasticsearch 安装 2.1.1 下载软件Elasticsearch 的官方地址：https://www.elastic.co/cn/Elasticsearch 最新的版本是 7.11.2（截止 2021.3.10），我们选择 7.8.0 版本（最新版本半年前的版本）下载地址：h 阅读全文

posted @ 2021-04-17 12:59 searchDM 阅读(112) 评论(0) 推荐(0) 编辑

Elasticsearch概述

摘要： 1.1 Elasticsearch 是什么 The Elastic Stack, 包括 Elasticsearch、Kibana、Beats 和 Logstash（也称为 ELK Stack）。能够安全可靠地获取任何来源、任何格式的数据，然后实时地对数据进行搜索、分析和可视化。Elaticsearc 阅读全文

posted @ 2021-04-17 08:48 searchDM 阅读(81) 评论(0) 推荐(0) 编辑

吴恩达自然语言处理第一课：分类与向量空间

摘要： supervised-ml-sentiment-analysis Supervised ML(training) 在监督机器学习中你要输入特征X和一组标签Y。现在为了确保基于你的数据能够得到最准确的预测，你的目标是尽可能减少错误率或成本。为了做到这一点，你要运行你的预测函数，它接受参数数据来映射你的阅读全文

posted @ 2021-04-17 07:53 searchDM 阅读(166) 评论(0) 推荐(0) 编辑

2013年3月30日

Linux下C语言字符串操作之字符串转数值型

摘要： 1，字符串转整型（一）#include <stdlib.h>int atoi(const char *nptr);字符串转化为整型long atol(const char *nptr);字符串转化为长整型long long atoll(const char *nptr);long long atoq(const char *nptr);字符串转化为long long 类型英文手册很简单，直接上说明：The atoi() function converts the initial portion of the string pointed to by nptr to int. The 阅读全文

posted @ 2013-03-30 08:55 searchDM 阅读(6780) 评论(0) 推荐(0) 编辑

2013年3月28日

lucene 3.4 contrib/facet 切面搜索

摘要： solr 有facet search ,BOBO也有；现在lucene3.4之后也有了，这个是贡献版本，在apache 官方的包里面有提供，这种功能对于分组统计和类别统计是一个很好的帮手；有了这个就不用羡慕solr了，不是我抗拒solr，只是像我们公司有时间让我们开发的情况下，我更偏向于底层点的api开发，lucene更得心应手。再说现在的solr没有近实时搜索，听说要4.0后有。废话不说，直接上代码public class Indexer { //需要索引的信息 public static String[] docTitles = { "white car", " 阅读全文

posted @ 2013-03-28 10:40 searchDM 阅读(433) 评论(0) 推荐(0) 编辑

2011年10月17日

在ubuntu上安装全文搜索中文分词Coreseek/sphinx及和Rails集成

摘要： Sphinx(狮身人面像) 想必大家都比较了解，就不作介绍了，不了解的童鞋可以自己Google。原生的Sphinx只支持中文，所以这里重点介绍支持中文分词的 Coreseek。注意：Coreseek 3.2 后，只有安装 Coreseek 就可以了,它对LibMMSeg和sphinx做了整合，不用再安装原生Sphinx。(3.2前是要安装原生Sphinx，还要装补丁,非常繁琐) 安装coreseek 下面以coreseek-3.2.14为例，它基于Sphinx 0.99(不用安装Sphinx 0.99）详细官方手册：http://www.coreseek.cn/product... 阅读全文

posted @ 2011-10-17 08:41 searchDM 阅读(535) 评论(0) 推荐(0) 编辑

solr3.4 高亮(highlight),拼写检查(spellCheck),匹配相似(moreLikeThis) 应用实践

摘要： Solr 是基于lucene的检索服务器。能够很快的搭建检索服务，并且提供的很多实用的组件。例如高亮(highlight)、拼写检查(spellCheck)和匹配相位(moreLikeThis)。下面我将在我工作中接触到的一些实践与大家分享。(我当前使用的solr 版本是 3.4，使用tomcat 7.0.21) (如果你也使用的是 tomcat 服务器，而且查询请求包含中文的话，还需要修改 TOMCAT_HOME/conf/server.xml 的 <Connector ... URIEncoding="UTF-8"/> 使用 UTF-8 编码，详见 U 阅读全文

posted @ 2011-10-17 08:31 searchDM 阅读(1027) 评论(0) 推荐(0) 编辑

wycg1984

公告