Fork me on GitHub
摘要: 使用npm下载express、request、cheerio。 request是关键,它可以获取目标网页的静态资源信息。 cheerio可以让获取到的html转换成jq一样操作,方便获取节点信息。 如果要复杂的爬虫,就要正则加递归,不断获取目标链接下关联链接的所有信息。 还有如果robots.txt 阅读全文
posted @ 2018-02-06 23:05 小数点就是问题 阅读(143) 评论(0) 推荐(0)