摘要: 摘自http://groups.google.com/group/python-cn/browse_thread/thread/8ad925031a97b8b2/a782b13f321a1ff8?#a782b13f321a1ff8[代码]出错的 HTML 代码是:很常见的问题,标准的HTML应该是:不知道是百度出于压缩考虑,还是它的技术人员偷懒应该用 tidy 之类的工具修补下,然后再用 BeautifulSoup 处理不过正如之前我那条不被人关注的帖子中所提到的,原有多个对 tidy 的 python 封装都不好用张教主推荐了个自己封装的 tidy ,可以试下 阅读全文
posted @ 2009-08-13 19:11 leavingme 阅读(703) 评论(2) 推荐(0)