zqwuwei的技术博客

理论指导实践,在实践中更好的理解理论
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

文章分类 -  名词解释

摘要:全文索引技术是目前搜索引擎的关键技术。试想在1M大小的文件中搜索一个词,可能需要几秒,在100M的文件中可能需要几十秒,如果在更大的文件中搜索那么就需要更大的系统开销,这样的开销是不现实的。所以在这样的矛盾下出现了全文索引技术,有时候有人叫倒排文档技术。原理是先定义一个词库,然后在文章中查找每个词条(term)出现的频率和位置,把这样的频率和位置信息按照词库的顺序归纳,这样就相当于对文件建立了一个... 阅读全文

posted @ 2007-06-04 11:03 zqwuwei 阅读(247) 评论(0) 推荐(0)

摘要:Unicode 问答集 小豆子 问:什么是Unicode?答:Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,... 阅读全文

posted @ 2007-05-31 11:15 zqwuwei 阅读(225) 评论(0) 推荐(0)

摘要:[ 2005-01-13 01:28 PM | 作者:zqss | 来自:[http://www.xcwww.cn]元数据描述数据的结构和意义,就象描述应用程序和进程的结构和意义一样。切记:元数据是抽象概念,具有上下文,在开发环境中有多种用途。元数据是抽象概念当人们描述现实世界的现象时,就会产生抽象信息,这些抽象信息便可以看作是元数据。例如,在描述风、雨和阳光这些自然现象时,就需要使用"天气"这类... 阅读全文

posted @ 2007-04-28 09:40 zqwuwei 阅读(468) 评论(1) 推荐(0)