随笔分类 - R
摘要:前一段时间在做关于美国请愿网站的研究,需要爬取change.org这个请愿网站上每个请愿的信息。大致爬虫顺序是:先爬取每个标签下所有请愿的名字和具体网址,访问每个具体网址爬取请愿的发起时间、内容等信息。这里就需要用到电脑模拟点击加载按钮、快捷键下载网页到本地的操作,也就需要用到Selenium和Py
阅读全文
摘要:大家好,给大家做一个关于R语言爬虫的分享,很荣幸也有些惭愧,因为我是一个编程菜鸟,社团里有很多优秀的同学经验比我要丰富的多,这次分享是很初级的,适用于没有接触过爬虫且有一些编程基础的同学,内容主要有以下几个方面:背景知识,爬取方法,数据处理和存储以及我学习编程以来的经验和教训。 背景知识一:爬虫是什
阅读全文