摘要: 人月 系统测试 空泛的估算 阅读全文
posted @ 2018-06-22 09:36 小张在搬砖 阅读(156) 评论(0) 推荐(0)
摘要: 网络爬虫是一个自动提取网页的程序。 传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。 聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取 阅读全文
posted @ 2018-06-22 09:36 小张在搬砖 阅读(242) 评论(0) 推荐(0)