08 2014 档案

摘要:转载:http://quweiprotoss.wap.blog.163.com/Push data to Solr or have Solr pull it尽管一个应用通过HTTP方式与Solr通信,并不意味着它需要将文档通过HTTP发送给Solr。Solr支持一种它称为remote streami... 阅读全文
posted @ 2014-08-28 18:02 勿妄 阅读(491) 评论(0) 推荐(0)
摘要:转载:http://quweiprotoss.wap.blog.163.com/ Solr Cell是一个针对Tika的简单适配器,它由一个SAX ContentHandler组成,ContentHandler处理SAX事件,并通过指定要抽取的域产生文档。在索引二制进文件的时候,有些事要注意:l你... 阅读全文
posted @ 2014-08-28 18:01 勿妄 阅读(344) 评论(0) 推荐(0)
摘要:转载:http://quweiprotoss.wap.blog.163.com/w2/DIH需要在solrconfig.xml中注册,如下:mb-dih-artists-jdbc.xml被引用的md-dih-artist-jdbc.xml位于/conf,它指定了数据导入过程的细节。我们会稍涉及一下这... 阅读全文
posted @ 2014-08-28 17:59 勿妄 阅读(472) 评论(0) 推荐(0)
摘要:1. 2. ... 阅读全文
posted @ 2014-08-28 17:32 勿妄 阅读(834) 评论(0) 推荐(0)
摘要:在理想的情况下,搜索引擎只返回与用户查询相关的文档。而在现实的查询中,编辑(没发现更合适的表达)通常需要指定特定文档在搜索结果中的特定位置。这样做有很多原因。或许 “置顶” 的文档就是最好的查询结果。也可能是公司想让客户从相似的选择中找到利润率较高的产品。还可能是由第三方付费,提高某些查询词语的排名... 阅读全文
posted @ 2014-08-28 16:36 勿妄 阅读(720) 评论(0) 推荐(0)
摘要:转载:http://mxsfengg.iteye.com/blog/308335通常,lucene只返回与用户查询相关的文档,搜索的结果,跟lucene对文档评分有关。而在现实的查询中,我们有些时候需要为某些特定的文档指定它们在搜索结果中的位置。solr1.3 新推的组件QueryElevation... 阅读全文
posted @ 2014-08-28 15:16 勿妄 阅读(888) 评论(0) 推荐(0)
摘要:DIH内存溢出: 在使用DIH时,容易报内存溢出错误。可以通过设置jvm大小来解决。设置方法如下: 在tomcat\bin\startup.bat加入SETJAVA_OPTS=-Xms128m-Xmx1024m配置这里设置的是1024M,根据情况可以适量增大datasourceentity:na... 阅读全文
posted @ 2014-08-27 17:35 勿妄 阅读(620) 评论(0) 推荐(0)
摘要:ALTER TABLE `tableName` ADD `updateAt` TIMESTAMP NULL ON UPDATE CURRENT_TIMESTAMP;ALTER TABLE kd_uploadinfo ADD optime TIMESTAMP NOT NULL DE... 阅读全文
posted @ 2014-08-27 11:31 勿妄 阅读(5413) 评论(0) 推荐(0)
摘要:原文出处:http://blog.chenlb.com/2010/03/solr-delete-data.html有时候需要删除 Solr 中的数据(特别是不重做索引的系统中,在重做索引期间)。删除一些 Solr 无效数据(或不合格数据)。删除 solr 中的数据有几种方式:1、先来看 curl 方... 阅读全文
posted @ 2014-08-20 17:34 勿妄 阅读(2463) 评论(0) 推荐(0)
摘要:资源网站:http://wiki.apache.org/velocity/ http://velocity.apache.org/engine/releases/velocity-1.7/user-guide.html 阅读全文
posted @ 2014-08-08 17:47 勿妄 阅读(102) 评论(0) 推荐(0)
摘要:Log4J的配置文件(Configuration File)就是用来设置记录器的级别、存放器和布局的,它可接key=value格式的设置或xml格式的设置信息。通过配置,可以创建出Log4J的运行环境。1. 配置文件Log4J配置文件的基本格式如下:#配置根Loggerlog4j.rootLogge... 阅读全文
posted @ 2014-08-08 14:45 勿妄 阅读(435) 评论(0) 推荐(0)
摘要:基于 Java 的网站开发,很多人都采用 JSP 作为前端网页制作的技术,尤其在是国内。这种技术通常有一些问题,我试想一下我们是怎样开发网站的,通常有几种方法:1:功能确定后,由美工设计网页的UI(界面)部分,然后由程序员在其上加入代码显示逻辑(比如循环,判断显示数据结果)。也就是通常的 jsp 页... 阅读全文
posted @ 2014-08-08 11:10 勿妄 阅读(333) 评论(0) 推荐(0)
摘要:/** * 汉字转换为拼音 包含多音字,包含生母zh,ch,sh的 */ public void toPinYinAll(){ String initials = "zh,ch,sh"; //返回汉语拼音的全拼 List result ... 阅读全文
posted @ 2014-08-06 17:28 勿妄 阅读(343) 评论(0) 推荐(0)
摘要:1 public static String[] array_unique(String[] a) {2 Set set = new HashSet();3 set.addAll(Arrays.asList(a));4 return set.toArray(new String[0]);5 } 阅读全文
posted @ 2014-08-06 16:37 勿妄 阅读(208) 评论(0) 推荐(0)
摘要:\t 相当于tab,缩进\n 回车\r 换行\b 换成 一个黑点 阅读全文
posted @ 2014-08-05 17:40 勿妄 阅读(145) 评论(0) 推荐(0)
摘要:solrj中配置:两种高亮开启设置// solrParams.setHighlight(true);solrParams.setParam("hl","true");//highlighting设置高亮字段: //高亮参数设置 那些字段高亮显示,可以用空格或者逗号分隔 solrParams.addH... 阅读全文
posted @ 2014-08-05 11:50 勿妄 阅读(1114) 评论(0) 推荐(0)
摘要:高亮显示在搜索中使用的比较多,比较常用的有三种使用方式,如果要对某field做高亮显示,必须对该field设置stored=true 第一种是普通的高亮显示Highlighter,根据查询的docIdSet,获取Documents,并获取当前document的需要高亮的field的value,根据q... 阅读全文
posted @ 2014-08-05 11:05 勿妄 阅读(670) 评论(0) 推荐(0)
摘要:做站内搜索时,如果输入的参数中包含英文冒号、双引号或其他具有特殊含义的字符时,可能需要做转义来避免查不到数据的问题。测试于:Solr 4.5.1, Jdk 1.6.0_45, Tomcat 6.0.37 | CentOS 5.7异常信息:如本站内有一篇文章标题为:java.lang.NumberFo... 阅读全文
posted @ 2014-08-04 18:19 勿妄 阅读(1218) 评论(0) 推荐(0)
摘要:在solr返回的结果集的content字段返回格式为:"content": ["测试content" ],经过对比title 和content字段,发现content配置多了一个mutiple属性: 去掉:content 的multiValued="true"属性,得到想要的结果: 阅读全文
posted @ 2014-08-04 14:42 勿妄 阅读(982) 评论(0) 推荐(0)
摘要:1. “:” 指定字段查指定值,如返回所有值*:*2. “?” 表示单个任意字符的通配3. “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)4. “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返... 阅读全文
posted @ 2014-08-01 16:45 勿妄 阅读(710) 评论(0) 推荐(0)
摘要:[]表示查询一个包括边界范围,{}表示查询一个不包括边界范围A TO * 表示没有上界即>=A或是>A ,视使用的是[]还是{}而定* TO A 表示没有下界即<=A或是<A ,视使用的是[]还是{}而定NOW表示当前时间,NOW/DAY表示当前日期.支持运算,比如取前一天就是NOW/DAY-1DA... 阅读全文
posted @ 2014-08-01 16:44 勿妄 阅读(2530) 评论(0) 推荐(0)