摘要: 索引构建 如何建倒排索引的过程称为索引构建(index construction 或 indexing),而将构建索引的程序或计算机称为索引器(indexer)。索引构建算法的设计受硬件的配置所制衡。 索引器需要原始文本,但是文本可能会采用各种编码格式。索引器对中间文件和最后的索引文件进行压缩或者解 阅读全文
posted @ 2016-12-28 20:15 Mr-cc 阅读(563) 评论(0) 推荐(0)
摘要: k gram索引的通配符查询处理技术称为k gram索引。 一个k gram代表由k个字符组成的序列。对于词项 来说, 、`ast stl $`来标识词项的开始或者结束,因此对于castle来说,所有的3 gram包括 、`cas ast stl tle $` . 在k gram索引结构中,其词典由 阅读全文
posted @ 2016-12-23 16:58 Mr-cc 阅读(1089) 评论(0) 推荐(0)
摘要: 我们需要更好地确定词典中的词项表,提供一个能够容忍拼写错误以及产讯和文档中词语表达不一致时的检索方法。 对能够表示某概念的复合词或者短语(如“operating system”)进行搜索是非常有用的。正如上面Westlaw的例子所示,有时我们希望能够执行诸如“Gates NEAR Microsoft 阅读全文
posted @ 2016-12-23 16:56 Mr-cc 阅读(178) 评论(0) 推荐(0)
摘要: 术语信息检索(Information Retrieval,简称IR) 。information retrieval广义上是获取信息的意思。然而学术意义上的信息检索定义为:信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。 非结构 阅读全文
posted @ 2016-12-23 16:55 Mr-cc 阅读(874) 评论(0) 推荐(0)
摘要: try catch finally的执行顺序学习 首先执行try,如果有异常执行catch,无论如何都会执行finally,当有return以后,函数就会把这个数据存储在某个位置,然后告诉主函数,我不执行了,接下来你执行吧,所以函数就会退出。首先执行try,如果有异常执行catch,无论如何都会执行 阅读全文
posted @ 2016-09-12 11:31 Mr-cc 阅读(194) 评论(0) 推荐(0)
摘要: 切记,不要忽略异常 尽管这条建议看上去显而易见,但是它常常被违反,因而值得再次被提出来。当API的设计者声明一个方法将被抛出某个异常的时候。他们等于正在试图说明某些事情。所以请不要忽略它!要忽略一个异常非常容易,只需要讲方法调用通过try语句包围起来,并包含一个catch块: 空的catch块会使异 阅读全文
posted @ 2016-08-31 11:57 Mr-cc 阅读(428) 评论(0) 推荐(0)
摘要: 常用的异常 | 异常 | 使用场合 | | | | | IllegalArgumentException | 非null的参数不正确 | | IllegalStateException | 对于方法调用而言,对象状态不合适 | | NullPointerException | 在禁止使用null的情 阅读全文
posted @ 2016-08-31 11:28 Mr-cc 阅读(147) 评论(0) 推荐(0)
摘要: 当心字符串的连接性能 字符串连接操作符(+)是把多个字符串合并为一个字符串的便利途径。要想产生单独一行的输出,或者构建一个字符串来表示一个较小的、大小固定的对象,使用连接符操作符是非常合适的,但是它不适合运用在大规模的场景中。未连接n个字符串而重复使用字符串连接操作符,需要n的平方级的时间。这是由于 阅读全文
posted @ 2016-08-31 10:21 Mr-cc 阅读(373) 评论(0) 推荐(0)
摘要: 将局部变量的作用域最小化 将局部变量的作用域最小化,可以增强代码的可读性和可维护性,并降低出错的可能性。 在较早的程序设计语言(C语言),要求局部变量必须在一个代码块的开头处进行声明,出于习惯,很多程序员目前还是继续这样做。这个习惯过应该纠正。再次提醒,Java允许你在任何可以出现语句的地方声明变量 阅读全文
posted @ 2016-08-31 09:21 Mr-cc 阅读(904) 评论(0) 推荐(1)
摘要: 理解国际站代码结构 O/R Mapping 是 Object Relationl Mapping(对象关系映射)的缩写。通俗点讲,就是对象与关系数据库绑定,用对象来表示关系数据。在O/R Mapping的世界里,有两个基本的也是很重要的东东需要了解一下,即VO,PO。 VO,值对象(Value Ob 阅读全文
posted @ 2016-08-30 11:36 Mr-cc 阅读(376) 评论(0) 推荐(0)