随笔分类 -  java

摘要:get方式提交的参数编码,只支持iso8859-1编码。因此,如果里面有中文,在后台就需要转换编码,如下Stringzhongwen=request.getParameter("zhongwen");zhongwen=newString(zhongwen.getBytes("iso8859-1"),... 阅读全文
posted @ 2014-10-31 14:17 飞扬的薰衣草 阅读(263) 评论(0) 推荐(0)
摘要:1.publicstaticbooleanisEmpty(String str) 判断某字符串是否为空,为空的标准是 str==null或 str.length()==0 下面是 StringUtils 判断是否为空的示例: StringUtils.isEmpty(null) = true... 阅读全文
posted @ 2014-09-12 15:26 飞扬的薰衣草 阅读(136) 评论(0) 推荐(0)
摘要:1. 编码问题的由来,相关概念的理解1.1 字符与编码的发展从计算机对多国语言的支持角度看,大致可以分为三个阶段:系统内码说明系统阶段一ASCII计算机刚开始只支持英语,其它语言不能够在计算机上存储和显示。英文 DOS阶段二ANSI编码(本地化)为使计算机支持更多语言,通常使用 0x80~0xFF ... 阅读全文
posted @ 2014-07-08 15:59 飞扬的薰衣草 阅读(199) 评论(0) 推荐(0)
摘要:概念说明:同义词大体的意思是指,当用户输入一个词时,solr会把相关有相同意思的近义词的或同义词的term的语段内容从索引中取出,展示给用户,提高交互的友好性(当然这些同义词的定义是要在配置文件中事先定义好的),比如:用户输入:日本,那么就可能有一些相关的近义词如:鬼子,屠杀,战犯等的词,这个可在配... 阅读全文
posted @ 2014-07-02 14:15 飞扬的薰衣草 阅读(302) 评论(0) 推荐(0)
摘要:Java中有一些开源的分词项目,比如:IK、Paoding、MMSEG4J等等。这里主要说的是MMSEG4J中使用的MMSeg算法。它的原文介绍在:http://technology.chtsai.org/mmseg/,是用英文书写的,这是只是它的一个中文笔记。为什么中文要分词中文和英文的书写方式不... 阅读全文
posted @ 2014-07-02 10:18 飞扬的薰衣草 阅读(333) 评论(0) 推荐(0)
摘要:1、json形式(比如把mongodb数据库的导出结果json)2、document形式3、solr中特殊字符处理:+ – && || ! ( ) { } [ ] ^ ” ~ * ? : \ 解决方法:在搜索的action中将输入的参数(kw为keywords的缩写)做转义处理,即import or... 阅读全文
posted @ 2014-06-27 15:36 飞扬的薰衣草 阅读(272) 评论(0) 推荐(0)
摘要:原文出自:http://cailin.iteye.com/blog/2014486ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等。Zookeeper是hadoop的一个子项目,其发展历程无需赘述。... 阅读全文
posted @ 2014-06-25 17:26 飞扬的薰衣草 阅读(150) 评论(0) 推荐(0)
摘要:1、当前目录打开命令窗口:shift+鼠标右键,然后打开命令窗口2、查看监听的端口:netstat–ano 阅读全文
posted @ 2014-06-25 16:42 飞扬的薰衣草 阅读(178) 评论(0) 推荐(0)
摘要:原文出自:http://sbp810050504.blog.51cto.com/2799422/1408322 按照该方法,伪分布式solr部署成功 前面简单了解了ZooKeeper的相关知识,为SolrCloud的学习作了一层铺垫。在SolrCl... 阅读全文
posted @ 2014-06-25 11:40 飞扬的薰衣草 阅读(346) 评论(0) 推荐(1)
摘要:使用Solr搭建搜索引擎很容易,但是如何制定合理的打分规则(boost)做排序却是一个很头痛的事情。Solr本身的排序打分规则是继承自Lucene的文本相关度的打分即boost,这一套算法对于通用的提供全文检索的服务来讲,已经够用了,但是对于一些专门领域的搜索来讲,文本相关度的打分是不合适的。如何来... 阅读全文
posted @ 2014-06-24 18:41 飞扬的薰衣草 阅读(643) 评论(0) 推荐(0)
摘要:help:active-profiles列出当前构建中活动的Profile(项目的,用户的,全局的)。help:effective-pom显示当前构建的实际POM,包含活动的Profile。help:effective-settings打印出项目的实际settings, 包括从全局的settings... 阅读全文
posted @ 2014-06-24 15:38 飞扬的薰衣草 阅读(1044) 评论(0) 推荐(0)
摘要:IDE:integrated development enterprise 集成开发环境;一、pom文件POM是项目对象模型(Project Object Model)的简称;maven世界中必须有的文件pom.xml文件,pom.xml是一个让Maven跑起来的文件。作用类似ant的build.x... 阅读全文
posted @ 2014-06-24 11:09 飞扬的薰衣草 阅读(192) 评论(0) 推荐(0)
摘要:要想在Solr中整合mmseg4j其实很容易,只需要如下几个步骤1、下载(https://code.google.com/p/mmseg4j/downloads/list)并解压mmseg4j-1.9.1.zip,把dist下面的所有jar文件拷贝到你应用服务器下的solr/WEB-INF/lib中... 阅读全文
posted @ 2014-06-23 19:18 飞扬的薰衣草 阅读(251) 评论(0) 推荐(0)
摘要:转帖地址:http://www.blogjava.net/conans/articles/379546.html以下资料整理自网络,觉的有必要合并在一起,这样方便查看。主要分为两部分,第一部分是对《db-data-config.xml》的配置内容的讲解(属于高级内容),第二部分是DataImport... 阅读全文
posted @ 2014-06-20 15:57 飞扬的薰衣草 阅读(854) 评论(0) 推荐(0)
摘要:原文出自:http://blog.csdn.net/junjieguo/article/details/7668775查看表结构 查看表结构可以用语句DESCRIBE或SHOW CREATE TABLE语句。 1、查看表的基本结构语句: DESCRIBE 表名; 2、查看表详细结构语句: ... 阅读全文
posted @ 2014-06-20 14:22 飞扬的薰衣草 阅读(330) 评论(0) 推荐(0)