摘要:
如果要求网页抓取和内容格式化工具软件DataScraper进行周期性网页抓取和信息提取,那么需要为DataScraper配置周期性网页抓取调度文件,这是一个XML文件,存放在主目录($HOME)下的目录.datascraper中,文件名字是crontab.xml。DataScraper运行的时候如果发现这个文件,将解析出周期性调度参数,如果设置了auto参数,将自动启动多个DataScraper进... 阅读全文
posted @ 2011-01-16 22:59
大CC
阅读(1232)
评论(0)
推荐(1)


浙公网安备 33010602011771号