摘要: 待续。。。 阅读全文
posted @ 2017-07-19 23:51 宝山方圆 阅读(1607) 评论(0) 推荐(0)
摘要: 数据来源:Python爬取新浪微博评论数据,写入csv文件中 本文等同:筛选出一段文字中的中文 阅读全文
posted @ 2017-07-19 23:46 宝山方圆 阅读(553) 评论(0) 推荐(0)
摘要: 因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式 操作步骤如下: 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题,获取对应的数据接口链接 4.获取cookies和headers 至于爬出来的数据有非中文的数据,要提取中文请参考:筛选出一段文字中的中文 未 阅读全文
posted @ 2017-07-19 23:42 宝山方圆 阅读(7403) 评论(19) 推荐(1)
摘要: 取出文档中的中文 待续。。。 阅读全文
posted @ 2017-07-19 23:26 宝山方圆 阅读(2685) 评论(0) 推荐(0)
摘要: 偶然了解到 Python 里的 itchat 包,它已经完成了 wechat 的个人账号 API 接口,使爬取个人微信信息更加方便。 于是乎玩心一起,打算爬一下自己的微信。 步骤核心: 网页启动notebook pip安装itchat包 登录微信,扫描二维码 获取好友信息 有了上面的friends数 阅读全文
posted @ 2017-07-19 11:06 宝山方圆 阅读(1636) 评论(0) 推荐(0)