随笔分类 -  collector

使用Jsoup解析html网页
摘要:一、 JSOUP简介 在以往用java来处理解析HTML文档或者片段时,我们通常会采用htmlparser(http://htmlparser.sourceforge.net/)这个开源类库。现在我们有了JSOUP,以后的处理HTML的内容只需要使用JSOUP就已经足够了,JSOUP有更快的更新,更 阅读全文
posted @ 2016-08-26 06:26 adolfmc 阅读(406) 评论(0) 推荐(0)
collector-quotest-mk
摘要:<config charset="utf-8"> <var-def name="start"> <html-to-xml> <http url="http://www.forexpros.com/quotes/single-currency-crosses" charset="utf-8" /> </html-to-xml> </var-def> <var-def name="ulList"> <xpath 阅读全文
posted @ 2012-11-25 00:12 adolfmc 阅读(220) 评论(0) 推荐(0)
webharvest-sample-1
摘要:<?xml version="1.0" encoding="UTF-8"?><config charset="UTF-8"> <file action="write" path="/home/administrator/mcc_workspace/webharvest/soft/exe/xquerytest.xml"> <xquery> <xq-param name="doc"><![CDATA[ <ta 阅读全文
posted @ 2012-11-24 23:35 adolfmc 阅读(297) 评论(0) 推荐(0)