黄聪

论SEO对人类的重要性,请看我的博客:hcsem.com

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2010年5月7日

摘要: 全文索引技术是目前搜索引擎的关键技术。 试想在1M大小的文件中搜索一个词,可能需要几秒,在100M的文件中可能需要几十秒,如果在更大的文件中搜索那么就需要更大的系统开销,这样的开销是不现实的。 所以在这样的矛盾下出现了全文索引技术,有时候有人叫倒排文档技术。 原理是先定义一个词库,然后在文章中查找每个词条(term)出现的频率和位置,把这样的频率和位置信息按照词库的顺序归纳,这样就相当于对文件建立了一个以词库为目录的索引,这样查找某个词的时候就能很快的定位到该词出现的位置。 问题在处理英文文档的时候显然这样的方式是非常好的,因为英文自然的被空格分成若干词,只要我们有足够大的词汇库就能很好的处. 阅读全文
posted @ 2010-05-07 11:01 黄聪 阅读(501) 评论(0) 推荐(0)

摘要: 在一个产品介绍网站中查询产品时,由于产品的介绍性文字可能会很长,如果使用对产品介绍字段使用like进行模糊查询,性能肯定会是问题。那么如何解决这个问题呢?第一个想法就是使用全文索引。那么全文索引是什么、应该如何应用、在应用的过程中又应该注意哪些事情呢?这个POST作为学习全文检索的笔记。 1、是什么 [摘录自SQL Server2000联机从书] 全文索引为在字符串数据中进行复杂的词搜索提供有效支持。全文索引存储关于重要词和这些词在特定列中的位置的信息。全文查询利用这些信息,可快速搜索包含具体某个词或一组词的行。 全文索引包含在全文目录中。每个数据库可以包含一个或多个全文目录。一个目录不能属于 阅读全文
posted @ 2010-05-07 02:31 黄聪 阅读(438) 评论(0) 推荐(0)

摘要: 今天在win7下安装好sql server express 2005,本地用户连接可以成功,但是尝试远程用ip登录,始终有错误,开始是18452,后来是18456,经过摸索,总结了一套配置流程,与大家分享如下:1.首先确保sql server 服务已经启动(这个可以在服务中看到)2.然后查看本地1433端口是否启动监听(用netstat -an)命令查看2.1 如果没有启动,进入“sql server 配置管理器”,点击“sql server 2005网络配置”--“sqlexpress网络协议”确保右边的4个协议都启动;然后右键单击“tcp/ip“,选择“属性”,进入“ip地址”选项页,确保 阅读全文
posted @ 2010-05-07 02:24 黄聪 阅读(18944) 评论(1) 推荐(2)

摘要: 联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。 当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易. 阅读全文
posted @ 2010-05-07 01:34 黄聪 阅读(4205) 评论(0) 推荐(2)

摘要: 文章出处: http://blog.csdn.net/gaojier1000/archive/2010/04/09/5468091.aspx以前的一次技术例会内容,拿出来共享一下,大家有问题可以提出来,一起提高。技术会议- SQL Server Partitioning V2※高捷本月技术会议专题为数据库分区( SQL Server Partitioning ),主要讲述为什么要分区,在什么情况下需要对数据进行分区,如何进行分区,分区表管理等内容。一、 摘要◆ 分区基础知识u SQL Server2005 分区u 技术讨论u 会议决议二、 分区技术知识1、 为什么要分区?(1) scale u 阅读全文
posted @ 2010-05-07 01:06 黄聪 阅读(888) 评论(0) 推荐(1)