07 2017 档案

摘要:对于这样的文本,要取到¥168这个值: <td class="total"><span class="money">¥</span>168</td> 注意:sub返回的不是list,而是字符串 阅读全文
posted @ 2017-07-18 09:41 桃乐丝 阅读(270) 评论(0) 推荐(0)
摘要:对于网页爬取结果为json格式的,可以直接使用python的json库解析,获取相应字段的值,比用正则匹配更简单规范。 阅读全文
posted @ 2017-07-13 09:38 桃乐丝 阅读(288) 评论(0) 推荐(0)
摘要:使用python的requests库爬取网页时,获取文本一般使用text方法,如果要获取图片并保存要用content 举个栗子,爬煎蛋网的图: 考虑到如果图片很大,获取需要时间,设置timeout超时避免内容取不完整。 写文件内容为r_img.content 打开文件的方式使用wb+,二进制文件覆盖 阅读全文
posted @ 2017-07-13 09:30 桃乐丝 阅读(323) 评论(0) 推荐(0)