摘要:
上文我们基本知道Tika是通过SAXParser来解析XHTML文档的,下面我通过一个具体的解析类HtmlParser入手,来看看网页文件的解析过程。首先看看HtmlParser类的继承层次,HtmlParser继承自抽象类AbstractParser,而AbstractParser实现了Parse... 阅读全文
posted @ 2013-03-07 18:19
刺猬的温驯
阅读(2445)
评论(0)
推荐(0)