会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
小数点就是问题
博客园
首页
新随笔
联系
订阅
管理
2018年2月6日
nodeJs简单版爬虫
摘要: 使用npm下载express、request、cheerio。 request是关键,它可以获取目标网页的静态资源信息。 cheerio可以让获取到的html转换成jq一样操作,方便获取节点信息。 如果要复杂的爬虫,就要正则加递归,不断获取目标链接下关联链接的所有信息。 还有如果robots.txt
阅读全文
posted @ 2018-02-06 23:05 小数点就是问题
阅读(143)
评论(0)
推荐(0)
公告