Fork me on GitHub

2010年1月13日

摘要: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head><meta http-equiv="keywords" content="keyword1,keyword2,keyword3"><meta http-equiv="description" co... 阅读全文
posted @ 2010-01-13 17:14 HackerVirus 阅读(226) 评论(0) 推荐(0)
摘要: ASP.Net处理Http Request时,使用Pipeline(管道)方式,由各个HttpModule对请求进行处理,然后到达 HttpHandler,HttpHandler处理完之后,仍经过Pipeline中各个HttpModule的处理,最后将HTML发送到客户端浏览 器中。生命周期中涉及到几个非常重要的对象:HttpHandler,HttpModule,IHttpHandlerFacto... 阅读全文
posted @ 2010-01-13 16:58 HackerVirus 阅读(318) 评论(0) 推荐(0)
摘要: 在网上看了一篇外文文章,里面介绍了提高Lucene索引速度的技巧,分享给大家。先来看下影响索引的主要因素:MaxMergeDocs该参数决定写入内存索引文档个数,到达该数目后就把该内存索引写入硬盘,生成一个新的索引segment文件。所以该参数也就是一个内存buffer,一般来说越大索引速度越快。MaxBufferedDocs这个参数默认是disabled的,因为Lucene中还用另外一个参数(R... 阅读全文
posted @ 2010-01-13 14:00 HackerVirus 阅读(482) 评论(0) 推荐(0)
摘要: 通常,Lucene的初学者们对Lucene.net索引文件的并发访问、IndexReader和IndexWriter的线程安全性存在一定的误解。而准确地理解这些内容是十分重要的。此文简单的论述下这两个问题。并发访问的规则Lucene提供了一些修改索引的方法,例如索引新文档、更新文档和删除文档;在执行这些操作时,为了避免对索引文件造成损坏,需要遵循一些特定的规则。这类问题通常会在web应用程序中突显... 阅读全文
posted @ 2010-01-13 13:59 HackerVirus 阅读(325) 评论(0) 推荐(0)
摘要: 前面的文章,我们已经对要检索的数据创建了索引,现在要做的就是为用户提供全文搜索的功能。通过Lucene我们还可以简单而高效地对搜索结果进行访问。此文和大家简单的说说利用Lucene.net进行数据的搜索。当我们查询Lucene的一个索引时,Lucene会返回一个有序的Hits对象集合(collection)Lucene使用默认的评分方式对该集合内的对象按照其得分高低进行排序。对于一个给定的查询,L... 阅读全文
posted @ 2010-01-13 13:56 HackerVirus 阅读(294) 评论(0) 推荐(0)
摘要: Lucene.net提供了很全面的数据搜索操作,你可以利用Lucene.net检索磁盘中的文件,网页,数据库中的数据,但是前提是预先对数据创建索引。Lucene索引过程分为三个主要的操作阶段:将数据转换成文本、分析文本、并将分析过的文本保存到索引库中。如图所示:1.数据转成文本:须将数据转换成Lucene能够处理的格式——纯文本字符流。2.分析文本:完成了针对待索引数据的预... 阅读全文
posted @ 2010-01-13 13:55 HackerVirus 阅读(450) 评论(0) 推荐(1)
摘要: 看上去还算是那么回事,我将利用几篇文章,和大家学习下Lucene.net创建索引,分词,检索等方面的知识。由于初学,有什么问题还望指教。此文先来和大家了解下Lucene.net,介绍给没有接触过的新手。Lucene:一个开源的使用Java语言编写的全文搜索引擎开发包。Lucene.net是使用在.NET平台下的搜索引擎开发工具,利用Lucene.net我们可以比较容易的搭建自己的数据检索程序。里面... 阅读全文
posted @ 2010-01-13 13:53 HackerVirus 阅读(378) 评论(0) 推荐(0)
摘要: 在搜索引擎技术中,分词对于影响搜索引擎结果排序有着至关重要的作用。与英文不同的是,中文之间没有空格,并且由于中国文字的博大精深,常常一句话可以分出很多不同效果的词汇,这里就不做举例了,想必大家都有所体会。所以对于一个中文搜索引擎来说,中文分词技术是十分重要的,也是十分讲究的。在搜索引擎运行的机制中,有很多种中文分词的办法,例如正向最大匹配分词,逆向最大分析,基于统计的分词,基于词库的分词等。但是在... 阅读全文
posted @ 2010-01-13 13:50 HackerVirus 阅读(1163) 评论(0) 推荐(0)

2010年1月12日

摘要: 工作进展有点慢,但我没偷懒。只是有些东西没有接触过,所以要慢慢摸索。总的来说,是缺乏经验。下午好像发现了jquery的一个不足之处,也不知道是不是我自己的原因。我在div里面放了一个tableMain,然后在tableMain里再嵌套了一个tableData。当我使用jquery的$(“#td_1”).className=”td_sel”时,发现$(... 阅读全文
posted @ 2010-01-12 16:15 HackerVirus 阅读(466) 评论(0) 推荐(0)
摘要: 开源网页编辑软件FCKEditor在09年发布更新到3.0,并改名为CKEditor。改进后的ckeditor更加模块话,配置更加灵活,和以前的fckeditor使用方式上也有所不同。在我的mvc项目中由于要用到 ckeditor,特意研究了下它的使用方法,写下来和大家分享。 我用的是最新版本的:ckeditor_3.0.1 下载地址:http://ckeditor.com/ 下载后直接解压得到c... 阅读全文
posted @ 2010-01-12 14:45 HackerVirus 阅读(1638) 评论(1) 推荐(0)