摘要:
一、基础知识 http://blog.csdn.net/pi9nc/article/details/9734437 二、模拟登录 因为上学期参加了一个大数据比赛,需要抓取数据,所以就想着写个爬虫抓取新浪微博的数据。 当然抓取数据不是漫无目的的,我需要的是根据关键词来抓取相关微博。 正好微博有一个高级 阅读全文
posted @ 2016-10-08 15:47
AmilyAmily
阅读(1239)
评论(0)
推荐(0)
摘要:
上学期参加了一个大数据比赛,需要抓取大量数据,于是我从新浪微博下手,本来准备使用新浪的API的,无奈新浪并没有开放关键字搜索的API,所以只能用爬虫来获取了。幸运的是,新浪提供了一个高级搜索功能,为我们爬取数据提供了一个很好的切入点。 在查阅了一些资料,参考了一些爬虫的例子后,得到大体思路:构造UR 阅读全文
posted @ 2016-10-08 15:46
AmilyAmily
阅读(12545)
评论(1)
推荐(1)

浙公网安备 33010602011771号