Spiga

随笔档案 - 2006年8月

使用XSLT进行XML的解析

2006-08-31 04:15 by cppguy, 68 visits, 网摘, 收藏, 编辑
摘要:XSLT(XSL Transformations)是把某一XML文档转换成其他格式的实际语言. 最简单的应用情况首先涉及到两个文档: 包含原始数据的XML文档和用来转换该文档的XSLT风格表单. XSLT处理器把XSLT风格表单的规则应用到XML文档从而新建XHTML,WML.SVG或者几乎其他任何的XML格式的第三方文挡 XSLT是XML的外观显示器. 阅读全文

Nutch 0.8在windows下使用的说明

2006-08-31 01:22 by cppguy, 436 visits, 网摘, 收藏, 编辑
摘要:Nutch 0.8在2006.7.25在其官方网站上正式发布,此版本在以前的基础上做了很大的改进.因此在进行爬行的时候不能完全按照各版本的方法进行.本人已经成功安装和使用,具体使用如下:辅助软件1、Java 1.4.x ;2、Apache's Tomcat 4.x ;3、Cygwin ; 使用 1、新建环境变量或添加环境变量新值PATH= F:\nutch-0.8\bin;(NUTCH-0.8的安... 阅读全文

剖析NUTCH爬虫[转贴]

2006-08-31 00:37 by cppguy, 816 visits, 网摘, 收藏, 编辑
摘要:针对整个爬行抓取过程做了简要的分析 阅读全文

介绍Nutch(翻译)

2006-08-28 23:14 by cppguy, 523 visits, 网摘, 收藏, 编辑
摘要: 介绍Nutch(1)(翻译)[原创] 原文地址:http://today.java.net/pub/a/today/2006/01/10/intro... Nutch可以分为2个部分:抓取部分和搜索部分。抓取程序抓取页面并把抓取回来的数据做成反向索引,搜索程序则对反向索引搜索回答用户的请求。抓取程序和搜索程序的接口是索引. 抓取程序是被Nutch的抓取工具驱动的。这是一组工具,用来建立... 阅读全文

应用lucene.net进行搜索测试

2006-08-27 14:23 by cppguy, 1490 visits, 网摘, 收藏, 编辑
摘要:已经应用lucene.net建立了全文索引,接下来演示用它来对关键字进行搜索 阅读全文

长大未老

2006-08-27 02:54 by cppguy, 79 visits, 网摘, 收藏, 编辑
摘要:现实的状况是:自己把稚嫩的童年 张扬的少年都送走了,22岁,一个流淌过太多忧伤和欢乐岁月的记号了,而这些还不够,走在大学尽头的自己还要经历最后一次有标记的青春散场.从一无所有到一无所有.  现在的自己知道张大了,因为经历过,所以体会到了.8年前,没有张大,那时一个还每天早晚骑车穿梭山村马路上的初中生,太多的欢乐,因为有太多不懂的事情被自己知道了.6年前,没有张大,第一次感到爱情的幸福,第一次为别人... 阅读全文

应用Lucene.net建立全文索引引擎

2006-08-26 18:00 by cppguy, 4782 visits, 网摘, 收藏, 编辑
摘要:Lucene,最初是Doug Cutting的一个个人项目,后来进入了开源社区,并得到了广泛的发展,此人也同为Nutch的创造者.lucene.net是lucene的c#实现版,我们可以在.net中建立不同的搜索引擎 阅读全文

Nutch的安装

2006-08-20 21:24 by cppguy, 606 visits, 网摘, 收藏, 编辑
摘要:集合了一些nutch的开发资源 阅读全文

初战luncene.net(1)

2006-08-20 16:08 by cppguy, 687 visits, 网摘, 收藏, 编辑
摘要:介绍lucene.net的最基本的用法 阅读全文

ajax+Lucene+nutch构造垂直搜索(1)

2006-08-20 01:06 by cppguy, 1858 visits, 网摘, 收藏, 编辑
摘要:垂直搜索是当前的热门技术,应用开源项目构建适合自己需要的搜索引擎 阅读全文

简单的rss阅读器

2006-08-20 01:00 by cppguy, 132 visits, 网摘, 收藏, 编辑
摘要:应用ajax技术 阅读全文

ASP.NET 2.0网站部署

2006-08-11 16:20 by cppguy, 760 visits, 网摘, 收藏, 编辑
摘要:初次部署ASP.NET 2.0网站有时会遇到一些困难,这里罗列一下部署的一般过程1.服务器必须安装.net framework 2.0,IIS 5.0以上,如果有用到数据库,这里以sqlserver express 2005为例,因为大部分此类网站都会用到membership,当然也可以把它迁移到sqlserver 2005上2:在IIS上建立虚拟目录,并在网站属性上 主目录栏里选中 脚本资源访问... 阅读全文