摘要: 如下面的 html里面的空格&nbsp,想直接用strip()函数去除是不可能的,必须显式的去掉\xa0 例如以上的就可以这样的方式去除空格 记录一下。 阅读全文
posted @ 2017-04-16 18:30 .每天进步一点点 阅读(2398) 评论(0) 推荐(0) 编辑
摘要: 很早就听说了pyquery的强大。写了个简单的测试程序实验下。 思路是找个动态网页,先用PhantomJS加载,然后用PYQUERY解析。 1、随便找了个带表格的股票网页,里面有大量的股票数据,测试的目的就是抓取表格中的数据。 链接如下 2、使用PhantomJS加载。 3、使用pyquery分析。 阅读全文
posted @ 2017-04-13 10:11 .每天进步一点点 阅读(1319) 评论(0) 推荐(0) 编辑
摘要: python3中的转码,必须是byte类型的,str类型的会返回未定义方法。 示例代码如下 byte类型的decode和encode方法就是用来做转码的。 阅读全文
posted @ 2017-04-12 10:46 .每天进步一点点 阅读(4303) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2017-04-12 10:41 .每天进步一点点 阅读(25) 评论(0) 推荐(0) 编辑