代码改变世界

Tidy - 一个把HTML 转成XHTML的工具库[整理]

2009-03-05 09:26  老博客哈  阅读(2831)  评论(2编辑  收藏  举报
    Tidy 最初由Dave Raggett设计,并通过W3C 网站以开放源代码许可协议分发。现在Tidy是由SourceForge上的一群志愿者在维护。
Tidy可以用来解析、格式化HTML,是一个出色的HTML解析引擎,它最初设计的目的是用来自动修正HTML中的错误和松散的标签。


Tidy项目可以访问( http://tidy.sourceforge.net/ )获得,目前最新的一次更新是2008年6月份。


下面使一些关于Tidy的一些资料:

1. Tidy最初的设计者Raggett关于它的详细介绍;
( http://www.w3.org/People/Raggett/tidy/ )

2. 技巧: 用 HTML Tidy 将 HTML 转换成XML ;
(  http://www.ibm.com/developerworks/cn/xml/x-tiptidy/#resources )

3. JTidy 是 HTML Tidy用Java实现的移植版本,提供了一个HTML的语法检查器和很好的打印功能,上一次更新的时间是2001年8月
( http://jtidy.sourceforge.net/ )

4. Ntidy是在Tidy基础上的.Net封装,上一次更新的时间是2004年1月
( http://sourceforge.net/projects/ntidy/ )

其它副产品资料:

1. NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。上一次更新的时间是2008年12月29日!(注:NekoHTML是java开源项目)
( http://sourceforge.net/projects/nekohtml )

2. Html2xhtmlCleaner能够将HTML转换成合法的XHTML文件,它还提供标签和属性过滤。它是codeproject上的.Net开源项目。
( http://www.codeproject.com/KB/cs/html2xhtmlcleaner.aspx )