04 2019 档案

摘要:老师:MissDu 提交作业 老师:MissDu 提交作业 0.从新闻url获取点击次数,并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) requests.get(clickUrl) re.search()/.split() s 阅读全文
posted @ 2019-04-15 11:46 刘睿智 阅读(180) 评论(0) 推荐(0)
摘要:恢复内容开始 一.简单说明爬虫原理 如果我们把互联网比作一张大的蜘蛛网,数据便是存放于蜘蛛网的各个节点,而爬虫就是一只小蜘蛛, 沿着网络抓取自己的猎物(数据)爬虫指的是:向网站发起请求,获取资源后分析并提取有用数据的程序; 从技术层面来说就是 通过程序模拟浏览器请求站点的行为,把站点返回的HTML代 阅读全文
posted @ 2019-04-01 20:10 刘睿智 阅读(235) 评论(0) 推荐(0)