摘要: 链接:http://china.nba.com/playerindex/ 所需获取JSON数据页面链接:http://china.nba.com/static/data/league/playerlist.json 数据来源:NBA中国官网 库: requests 用于解析页面文本数据 pandas 阅读全文
posted @ 2017-02-18 01:32 BuddyQuan 阅读(5634) 评论(2) 推荐(4) 编辑
摘要: 那我们到底是应该直接使用这些模块级别的函数呢,还是先编译一个模式对象,再调用模式对象的方法呢?这其实取决于正则表达式的使用频率,如果说我们这个程序只是偶尔使用到正则表达式,那么全局函数是比较方便的;如果我们的程序是大量的使用正则表达式(例如在一个循环中使用),那么建议你使用后一种方法,因为预编译的话 阅读全文
posted @ 2017-02-17 14:54 BuddyQuan 阅读(216) 评论(0) 推荐(0) 编辑
摘要: 链接:http://www.p2p001.com/licai/index/id/147.html 所需获取数据链接类似于:http://www.p2p001.com/licai/shownews/id/454.html: 库: requests (For human) re (正则) pandas 阅读全文
posted @ 2017-02-14 22:13 BuddyQuan 阅读(1206) 评论(5) 推荐(0) 编辑
摘要: 给你一个眼神,自己体会 阅读全文
posted @ 2017-01-18 15:05 BuddyQuan 阅读(179) 评论(0) 推荐(0) 编辑
摘要: python 版本 :3.5.2 Jupyter Notebook 使用库: reuqests (For human) json (用来加载JSON数据) datetime (用来记录抓取所花时间,也可以忽略) pymysql (连接数据库,载入所爬取数据 ) 1.用chrome浏览器打开网贷之家官 阅读全文
posted @ 2017-01-17 16:09 BuddyQuan 阅读(8565) 评论(3) 推荐(0) 编辑
摘要: 看理论硬是看的抓狂,然后去百度贴吧看到了一句话,什么叫python生成器,简直秒懂 阅读全文
posted @ 2016-12-30 15:33 BuddyQuan 阅读(281) 评论(0) 推荐(0) 编辑