摘要: string str = "我们是中国人; 我们 是 人;we are chiness; 172.16.34.172;youpeizun@126.com;#$*;85*34;58 69;"; QueryParser qp = new QueryParser("aa",new StandardAnalyzer()); Query qe = null; qe = qp.Parse(str); Resp... 阅读全文
posted @ 2009-07-27 09:36 周骏 阅读(356) 评论(0) 推荐(0)
摘要: 一个小型的网站,比如个人网站,可以使用最简单的html静态页面就实现了,配 合一些图片达到美化效果,所有的页面均存放在一个目录下,这样的网站 对系统架构、性能的要求都很简单,随着互联网业务的不断丰富,网站相关的技术经过这些年的发展,已经细分到很细的方方面面,尤其对于大型网站来说,所采用 的技术更是涉及面非常广,从硬件到软件、编程语言、数据库、WebServer、防火墙等各个领域都有了很高的要求,已... 阅读全文
posted @ 2009-07-27 09:33 周骏 阅读(300) 评论(0) 推荐(0)
摘要: MySpace.com有着6500万的订阅者,是因特网上增长最快的网站之一,每天还有260,000新用户注册。它经常因为性能问题而受指责,MySpace不得不处理其他网站很少碰到的或大或小的一些问题。它们是怎么做的呢? Site: http://myspace.com 站点:http://myspace.com 平台 • ASP.NET 2.0 • Windows ... 阅读全文
posted @ 2009-07-27 09:32 周骏 阅读(590) 评论(0) 推荐(0)
摘要: #region 建立索引 public void CreateIndex() { DataSet ds = 取得数据库信息; //取得索引输出 IndexWriter writer = new IndexWriter(这个地方写保存路径, true); writer.SetMergeFactor(20); // 调整segment合并的频率和大小 //建立索引字段 if (ds.Tables[0... 阅读全文
posted @ 2009-07-27 09:31 周骏 阅读(484) 评论(0) 推荐(0)
摘要: 对于数据量大(索引文件大于50M)的索引,尽量不要用索引中的字段排序,要用索引ID排序(INDEXORDER);两者效率相差近10倍,以下从内存占用与CPU处理时间来比较: 内存占用比较: 图一:使用整型的唯一标识字段排序 图二:使用索引ID(INDEXORDER)排序 拿占用内存最多的对象来比较:我们可以看到,图一比图二多 2,900,766 bytes(索引文件大小:61M) 处理时间比较... 阅读全文
posted @ 2009-07-27 09:30 周骏 阅读(534) 评论(0) 推荐(0)
摘要: 第一、 按词条搜索 - TermQuery query = new TermQuery(new Term("name","word1")); hits = searcher.search(query); 这样就可以把 field 为 name 的所有包含 word1 的文档检索出来了。 第二、 “与或”搜索 - BooleanQuery 它实际是一个组合 que... 阅读全文
posted @ 2009-07-27 09:25 周骏 阅读(554) 评论(0) 推荐(0)
摘要: string INDEX_STORE_PATH = Server.MapPath("index");//INDEX_STORE_PATH 为索引存储目录 string keyword = TextBox2.Text;//搜索内容 Hits myhit = null; IndexSearcher mysea = new IndexSearcher(INDEX_STORE_PATH); QueryP... 阅读全文
posted @ 2009-07-27 09:24 周骏 阅读(909) 评论(1) 推荐(1)
摘要: 1. 基本应用using System;using System.Collections.Generic;using System.Text;using Lucene.Net;using Lucene.Net.Analysis;using Lucene.Net.Analysis.Standard;using Lucene.Net.Documents;using Lucene.Net.Index;u... 阅读全文
posted @ 2009-07-27 09:23 周骏 阅读(530) 评论(0) 推荐(0)
摘要: 1. 基本应用 using System; using System.Collections.Generic; using System.Text; using Lucene.Net; using Lucene.Net.Analysis; using Lucene.Net.Analysis.Standard; using Lucene.Net.Documents; using Lucene.Net... 阅读全文
posted @ 2009-07-27 09:22 周骏 阅读(567) 评论(0) 推荐(1)
摘要: 一,信息检索的过程简介 全文检索和数据库应用最大的不同在于:让最相关的头100条结果满足98%以上用户的需求 1,构建文本库 在开发功能前,一个信息检索系统需要做些准备工作,首先,必须要构建一个文本数据库,这个文本数据库用来保存所有用户可能检索的信息。在这些信息的基础上,确定索引中 的文本类型,文本类型是被系统所认可的一种信息格式,这种格式应当具有可识别,冗余程度低的特点。一旦文本模型确定下来后... 阅读全文
posted @ 2009-07-27 09:20 周骏 阅读(666) 评论(0) 推荐(0)
摘要: 在lucene.net中,典型的索引文件操作代码如下: IndexWriter writer = new IndexWriter("c:\index", new StandardAnalyzer(), true); try { Document doc = new Document(); doc.Add(Field.Keyword("name", "name name"); doc.Add(Fie... 阅读全文
posted @ 2009-07-27 09:19 周骏 阅读(669) 评论(0) 推荐(0)
摘要: 其实 Lucene.net 对数据库建索引很简单,只要把数据表里面的记录读出来,然后对每个字段索引就行了.本文中数据库的内容是某个博客表-userblog表。 1.表结构: 字段名称 字段类型 字段含义 id Varchar(11) 编号 title Varchar(50) 标题 content Text 内容 2.程序流程 1) 打开数据库; 2) 建立索引; 3) 根据索引进行全文搜索. 4... 阅读全文
posted @ 2009-07-27 09:18 周骏 阅读(726) 评论(0) 推荐(0)
摘要: Lucene.net是目前在.net环境中被普遍使用的全文索引的开源项目,这次在项目的开发中也使用它进行全文索引。 在开发过程中碰到一些小问题就是对多字段和多索引目录进行搜索。 1、多字段搜索就是同时要一个以上的字段中的内容进行比较搜索,类似概念在SQL中就是select * from Table where a like '%query%' or b like '%query%'。 Lucen... 阅读全文
posted @ 2009-07-27 09:17 周骏 阅读(670) 评论(0) 推荐(1)
摘要: 1. 有时对于一个Document来说,有一些Field会被频繁地操作,而另一些Field则不会。这时可以将频繁操作的Field和其他Field分开存 放,而在搜索时同时检索这两部分Field而提取出一个完整的Document。 这要求两个索引包含的Document的数量必须相同。 在创建索引的时候,可以同时创建多个IndexWriter,将一个Document根据需要拆分成多个包含部分Field... 阅读全文
posted @ 2009-07-27 09:15 周骏 阅读(527) 评论(0) 推荐(0)
摘要: 在编写多线程程序时无可避免会遇到线程的同步问题。什么是线程的同步呢?   举个例子:如果在一个公司里面有一个变量记录某人T的工资count=100,有两个主管A和B(即工作线程)在早一些时候拿了这个变量的值回去,过 了一段时间A主管将T的工资加了5块,并存回count变量,而B主管将T的工资减去3块,并存回count变量。好了,本来T君可以得到102块的工资 的,现在就变成98块了。这就是线程同... 阅读全文
posted @ 2009-07-27 09:13 周骏 阅读(411) 评论(0) 推荐(0)
摘要: 判断jquery对象是否可见 2008年10月09日 星期四 上午 09:12 if ($("p").is(":visible")){...} 阅读全文
posted @ 2009-07-27 09:10 周骏 阅读(3379) 评论(0) 推荐(0)
摘要: //blog.js var blog = {};//初始化命名空间 blog.utility = { Version : 'blog.utility version 0.0.1', sayHello: function (str) { alert('hello : '+str +' by ' + this.getVersion()); }, getVersion :function () { r... 阅读全文
posted @ 2009-07-27 09:07 周骏 阅读(274) 评论(0) 推荐(0)
摘要: 1. Make fewer HTTP requests 尽可能少的http请求。。我们有141个请求(其中15个JS请求,3个CSS请求,47个CSS background images请求),多的可怕。思考了下,为什么把这个三种请求过多列为对页面加载的重要不利因素呢,而过多的IMG请求并没有列为不利因素呢? 发现原来这些请求都是可以避免的。 15个JS和3个CSS完全可以通过特殊的办法进行合并(... 阅读全文
posted @ 2009-07-27 09:06 周骏 阅读(441) 评论(1) 推荐(0)
摘要: --按照月份统计 select count(id) cnt,datepart(mm,time) [Month] from [table] where [time] between '2007/09/08 09:10:43' and '2007/10/09 04:32:37' group by datepart(mm,time) --按照日统计 select count(id) cnt,datepa... 阅读全文
posted @ 2009-07-27 09:01 周骏 阅读(1826) 评论(0) 推荐(0)
摘要: 1.什么时候用委托: 当给一个方法传递的参数是方法,而不是数据的时候,要使用委托。如:多线程、事件、运行时才能确认的应用程序等。 2.如何使用委托: 定义委托:(与类相同)delegate string GetAString(); 实例化:GetAString testString=new GetAString("test".ToString()); 运行: Console.Write(testS... 阅读全文
posted @ 2009-07-27 09:01 周骏 阅读(387) 评论(0) 推荐(0)