08 2014 档案
摘要:转载:http://quweiprotoss.wap.blog.163.com/Push data to Solr or have Solr pull it尽管一个应用通过HTTP方式与Solr通信,并不意味着它需要将文档通过HTTP发送给Solr。Solr支持一种它称为remote streami...
阅读全文
摘要:转载:http://quweiprotoss.wap.blog.163.com/ Solr Cell是一个针对Tika的简单适配器,它由一个SAX ContentHandler组成,ContentHandler处理SAX事件,并通过指定要抽取的域产生文档。在索引二制进文件的时候,有些事要注意:l你...
阅读全文
摘要:转载:http://quweiprotoss.wap.blog.163.com/w2/DIH需要在solrconfig.xml中注册,如下:mb-dih-artists-jdbc.xml被引用的md-dih-artist-jdbc.xml位于/conf,它指定了数据导入过程的细节。我们会稍涉及一下这...
阅读全文
摘要:在理想的情况下,搜索引擎只返回与用户查询相关的文档。而在现实的查询中,编辑(没发现更合适的表达)通常需要指定特定文档在搜索结果中的特定位置。这样做有很多原因。或许 “置顶” 的文档就是最好的查询结果。也可能是公司想让客户从相似的选择中找到利润率较高的产品。还可能是由第三方付费,提高某些查询词语的排名...
阅读全文
摘要:转载:http://mxsfengg.iteye.com/blog/308335通常,lucene只返回与用户查询相关的文档,搜索的结果,跟lucene对文档评分有关。而在现实的查询中,我们有些时候需要为某些特定的文档指定它们在搜索结果中的位置。solr1.3 新推的组件QueryElevation...
阅读全文
摘要:DIH内存溢出: 在使用DIH时,容易报内存溢出错误。可以通过设置jvm大小来解决。设置方法如下: 在tomcat\bin\startup.bat加入SETJAVA_OPTS=-Xms128m-Xmx1024m配置这里设置的是1024M,根据情况可以适量增大datasourceentity:na...
阅读全文
摘要:ALTER TABLE `tableName` ADD `updateAt` TIMESTAMP NULL ON UPDATE CURRENT_TIMESTAMP;ALTER TABLE kd_uploadinfo ADD optime TIMESTAMP NOT NULL DE...
阅读全文
摘要:原文出处:http://blog.chenlb.com/2010/03/solr-delete-data.html有时候需要删除 Solr 中的数据(特别是不重做索引的系统中,在重做索引期间)。删除一些 Solr 无效数据(或不合格数据)。删除 solr 中的数据有几种方式:1、先来看 curl 方...
阅读全文
摘要:资源网站:http://wiki.apache.org/velocity/ http://velocity.apache.org/engine/releases/velocity-1.7/user-guide.html
阅读全文
摘要:Log4J的配置文件(Configuration File)就是用来设置记录器的级别、存放器和布局的,它可接key=value格式的设置或xml格式的设置信息。通过配置,可以创建出Log4J的运行环境。1. 配置文件Log4J配置文件的基本格式如下:#配置根Loggerlog4j.rootLogge...
阅读全文
摘要:基于 Java 的网站开发,很多人都采用 JSP 作为前端网页制作的技术,尤其在是国内。这种技术通常有一些问题,我试想一下我们是怎样开发网站的,通常有几种方法:1:功能确定后,由美工设计网页的UI(界面)部分,然后由程序员在其上加入代码显示逻辑(比如循环,判断显示数据结果)。也就是通常的 jsp 页...
阅读全文
摘要:/** * 汉字转换为拼音 包含多音字,包含生母zh,ch,sh的 */ public void toPinYinAll(){ String initials = "zh,ch,sh"; //返回汉语拼音的全拼 List result ...
阅读全文
摘要:1 public static String[] array_unique(String[] a) {2 Set set = new HashSet();3 set.addAll(Arrays.asList(a));4 return set.toArray(new String[0]);5 }
阅读全文
摘要:solrj中配置:两种高亮开启设置// solrParams.setHighlight(true);solrParams.setParam("hl","true");//highlighting设置高亮字段: //高亮参数设置 那些字段高亮显示,可以用空格或者逗号分隔 solrParams.addH...
阅读全文
摘要:高亮显示在搜索中使用的比较多,比较常用的有三种使用方式,如果要对某field做高亮显示,必须对该field设置stored=true 第一种是普通的高亮显示Highlighter,根据查询的docIdSet,获取Documents,并获取当前document的需要高亮的field的value,根据q...
阅读全文
摘要:做站内搜索时,如果输入的参数中包含英文冒号、双引号或其他具有特殊含义的字符时,可能需要做转义来避免查不到数据的问题。测试于:Solr 4.5.1, Jdk 1.6.0_45, Tomcat 6.0.37 | CentOS 5.7异常信息:如本站内有一篇文章标题为:java.lang.NumberFo...
阅读全文
摘要:在solr返回的结果集的content字段返回格式为:"content": ["测试content" ],经过对比title 和content字段,发现content配置多了一个mutiple属性: 去掉:content 的multiValued="true"属性,得到想要的结果:
阅读全文
摘要:1. “:” 指定字段查指定值,如返回所有值*:*2. “?” 表示单个任意字符的通配3. “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)4. “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返...
阅读全文
摘要:[]表示查询一个包括边界范围,{}表示查询一个不包括边界范围A TO * 表示没有上界即>=A或是>A ,视使用的是[]还是{}而定* TO A 表示没有下界即<=A或是<A ,视使用的是[]还是{}而定NOW表示当前时间,NOW/DAY表示当前日期.支持运算,比如取前一天就是NOW/DAY-1DA...
阅读全文