Tidy - 一个把HTML 转成XHTML的工具库[整理]
2009-03-05 09:26 老博客哈 阅读(2855) 评论(2) 编辑 收藏 举报
Tidy 最初由Dave Raggett设计,并通过W3C 网站以开放源代码许可协议分发。现在Tidy是由SourceForge上的一群志愿者在维护。
Tidy可以用来解析、格式化HTML,是一个出色的HTML解析引擎,它最初设计的目的是用来自动修正HTML中的错误和松散的标签。
Tidy项目可以访问(http://tidy.sourceforge.net/ )获得,目前最新的一次更新是2008年6月份。
下面使一些关于Tidy的一些资料:
1. Tidy最初的设计者Raggett关于它的详细介绍;
(http://www.w3.org/People/Raggett/tidy/ )
2. 技巧: 用 HTML Tidy 将 HTML 转换成XML ;
(http://www.ibm.com/developerworks/cn/xml/x-tiptidy/#resources )
3. JTidy 是 HTML Tidy用Java实现的移植版本,提供了一个HTML的语法检查器和很好的打印功能,上一次更新的时间是2001年8月;
(http://jtidy.sourceforge.net/ )
4. Ntidy是在Tidy基础上的.Net封装,上一次更新的时间是2004年1月。
(http://sourceforge.net/projects/ntidy/ )
其它副产品资料:
1. NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。上一次更新的时间是2008年12月29日!(注:NekoHTML是java开源项目)
(http://sourceforge.net/projects/nekohtml )
2. Html2xhtmlCleaner能够将HTML转换成合法的XHTML文件,它还提供标签和属性过滤。它是codeproject上的.Net开源项目。
(http://www.codeproject.com/KB/cs/html2xhtmlcleaner.aspx )
Tidy可以用来解析、格式化HTML,是一个出色的HTML解析引擎,它最初设计的目的是用来自动修正HTML中的错误和松散的标签。
Tidy项目可以访问(
1. Tidy最初的设计者Raggett关于它的详细介绍;
(
2. 技巧: 用 HTML Tidy 将 HTML 转换成XML ;
(
3. JTidy 是 HTML Tidy用Java实现的移植版本,提供了一个HTML的语法检查器和很好的打印功能,上一次更新的时间是2001年8月
(
4. Ntidy是在Tidy基础上的.Net封装,上一次更新的时间是2004年1月
(
1. NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。上一次更新的时间是2008年12月29日!(注:NekoHTML是java开源项目)
(
2. Html2xhtmlCleaner能够将HTML转换成合法的XHTML文件,它还提供标签和属性过滤。它是codeproject上的.Net开源项目。
(