2015年10月14日

摘要: 观察基础信息(服务器信息和提交给服务器的信息)d=debugGatherer()xpath="http://123.sogou.com/"url=getURL(xpath,debugfuNction=d$update,verbose=T)cat(d$value()[1])#服务器地址以及端口号cat... 阅读全文
posted @ 2015-10-14 13:48 不告诉你的秘密 阅读(2458) 评论(0) 推荐(0)
 

2015年9月29日

摘要: htmlParse 函数htmlParse加抓HTML页面的函数。url1<-"http://www.caixin.com/"url<-htmlParse(url1,encoding="UTF-8")但是有的网站会出现报错。例如淘宝,错误信息为:Warning message:XML content... 阅读全文
posted @ 2015-09-29 16:50 不告诉你的秘密 阅读(3569) 评论(0) 推荐(0)