2008年11月6日

解析Html生成标签树(二)

摘要: 前面两篇讲解了解析Html成标签树的思想个核心算法,感谢各位提出了意见。先专门列出一文作为解释 阅读全文

posted @ 2008-11-06 15:55 田景 阅读(762) 评论(1) 推荐(0) 编辑

解析Html生成标签树(一)

摘要: 本文介绍了如果将Html文件解析成以Html标签(tag)为节点的标签树,这在搜索引擎中是非常重要的一个环节,虽然目前已经存在了一些开源的解析包或者软件,但是都是使用正则表达式的方式来处理,你可能也知道,正则表达式是非常难于理解掌握的。并且通过正则表达式的方式,我们在对Html进行解析(特别是在垂直搜索引擎中)是很容易受制于源网站的,源网站的页面Html的任何变动都可能直接导致我们的抓取正则的修改。所以本文给出了一个解析Html为标签树的方法,这样通过遍历树节点,我们很容易拿到需要的信息。同时在网页正文的获取方面,通过标签树也变得很简单。 阅读全文

posted @ 2008-11-06 15:54 田景 阅读(1330) 评论(1) 推荐(0) 编辑

解析Html生成标签树(前言)

摘要: 搜索引擎一个最重要的步骤就是,获得网页的正文内容,我相信每个人看见一篇网页的时候,从视觉上都很容易知道哪个部分是正文内容,哪个部分是版权信息,哪个部分是广告信息。但是要让计算机明白这些,估计要若干年(到时候还不知道人类是否已经变异成4只眼睛,5个耳朵。。。)之后。在网络上大量存在一些关于网页正文抽取的理论性文章,最著名的应该数介绍北大天网的《搜索引擎原理技术与系统》一书中所介绍的网页净化技术了,中心思想大概就是,首先将Html源文件解析成一棵以Html标签为节点的树(为了后面的描述方便,我们称其为“Html树”) 阅读全文

posted @ 2008-11-06 15:53 田景 阅读(312) 评论(1) 推荐(0) 编辑

C#基础系列:开发自己的窗体设计器(PropertyGrid显示中文属性名)

摘要: 本文介绍了在PropertyGrid中显示中文属性名的方法,以及我们仅仅显示控件的某几个属性的方法和技巧,希望对朋友们有所帮助。 阅读全文

posted @ 2008-11-06 15:51 田景 阅读(1585) 评论(1) 推荐(0) 编辑

C#基础系列:开发自己的窗体设计器(实现控件的拖动)

摘要: 本文讲述了实现一个与具体控件无关的控件移动类。 阅读全文

posted @ 2008-11-06 15:50 田景 阅读(902) 评论(0) 推荐(0) 编辑

C#基础系列:开发自己的窗体设计器(实现控件的选择)

摘要: 本文给出了设计器中当选择了某个控件后,能够在控件周围显示大小调整手柄的方法。 阅读全文

posted @ 2008-11-06 15:49 田景 阅读(685) 评论(0) 推荐(0) 编辑

C#基础系列:开发自己的窗体设计器(在容器上拖动鼠标增加控件)

摘要: 本文通过一个简单的演示程序,说明了怎样通过拖动鼠标,在容器控件上增加选择的控件。并且给出了完整的代码,其中MouseHook是整个代码的核心。 阅读全文

posted @ 2008-11-06 15:48 田景 阅读(714) 评论(0) 推荐(0) 编辑

C#基础系列:开发自己的窗体设计器(总纲)

摘要: 我正在开发的一个窗体设计器,希望能够实现中小用户能够根据自己的需要自行设计所使用的单据。 阅读全文

posted @ 2008-11-06 15:46 田景 阅读(1361) 评论(0) 推荐(0) 编辑

GZipStream实现压缩以及出现的问题

摘要: GZipStream在压缩和解压的时候,如果压缩后数据小于4K,那么就不能正常解压,原因是GZipStream是按照4K大小的块为单位来进行存取的,那么请你注意看我这篇文章了。 阅读全文

posted @ 2008-11-06 15:37 田景 阅读(434) 评论(0) 推荐(0) 编辑

DataGridView导出到Excel

摘要: 在vs2005中使用office2003,特别是将DataGridView导出到Excel的引用,对于新手可能会碰到很多的问题,比如不能添加Excel的引用,以及导出速度慢等问题,我把这个问题描述出来并且解决他,给别人一个参考同时也给自己一个备份积累。 阅读全文

posted @ 2008-11-06 15:35 田景 阅读(465) 评论(1) 推荐(0) 编辑

在C#应用中,设计自己的配置文件

摘要: 通过一个构造菜单的例子来描述,怎么设计我们自己的配置文件,通过这样的设计,我们可以避免直接操作XMLDocument的复杂的API等等。 阅读全文

posted @ 2008-11-06 15:33 田景 阅读(265) 评论(0) 推荐(0) 编辑

C#基础系列:实现自己的ORM(MiniORM的测试代码)

摘要: 看到有同学反馈,说MiniORM代码有Bug,也不知道怎么用,所以今天我就写了些测试代码。希望能够给点帮助 阅读全文

posted @ 2008-11-06 15:31 田景 阅读(317) 评论(0) 推荐(0) 编辑

C#基础系列:实现自己的ORM(构造我自己的ORM)

摘要: 本章通过我自己开发的一个演示用的ORM来详细地讲解开发一个简单ORM的时候需要注意到的问题以及解决方法。并配有详细的代码讲解。 阅读全文

posted @ 2008-11-06 15:29 田景 阅读(490) 评论(0) 推荐(0) 编辑

C#基础系列:实现自己的ORM(反射以及Attribute在ORM中的应用)

摘要: 本章讲解的是实现ORM需要使用到的一些技术和实现方法,详细讲述了反射和Attribute的应用。对于刚接触的人这个部分是必须掌握的,否则到后面的章节基本没有办法掌握。欢迎大牛们拍砖,提意见。 阅读全文

posted @ 2008-11-06 15:28 田景 阅读(525) 评论(0) 推荐(0) 编辑

C#基础系列:实现自己的ORM(ORM的基础概念)

摘要: 本章节讲述的是ORM的基础概念,这对于了解ORM以及ORM的实现方式是最基础的,所以建议如果对ORM不了解的情况先看本章。 阅读全文

posted @ 2008-11-06 15:26 田景 阅读(1634) 评论(0) 推荐(0) 编辑

导航