随笔分类 -  R

摘要:前一段时间在做关于美国请愿网站的研究,需要爬取change.org这个请愿网站上每个请愿的信息。大致爬虫顺序是:先爬取每个标签下所有请愿的名字和具体网址,访问每个具体网址爬取请愿的发起时间、内容等信息。这里就需要用到电脑模拟点击加载按钮、快捷键下载网页到本地的操作,也就需要用到Selenium和Py 阅读全文
posted @ 2020-08-18 12:02 🌧🌤☀ 阅读(1683) 评论(0) 推荐(0)
摘要:大家好,给大家做一个关于R语言爬虫的分享,很荣幸也有些惭愧,因为我是一个编程菜鸟,社团里有很多优秀的同学经验比我要丰富的多,这次分享是很初级的,适用于没有接触过爬虫且有一些编程基础的同学,内容主要有以下几个方面:背景知识,爬取方法,数据处理和存储以及我学习编程以来的经验和教训。 背景知识一:爬虫是什 阅读全文
posted @ 2020-03-22 12:59 🌧🌤☀ 阅读(439) 评论(0) 推荐(0)
摘要:正则表达式,R和python都有 阅读全文
posted @ 2020-03-19 23:05 🌧🌤☀ 阅读(361) 评论(0) 推荐(0)
摘要:一些关于数据基本操作的语法 阅读全文
posted @ 2020-03-19 21:09 🌧🌤☀ 阅读(508) 评论(0) 推荐(0)