2017 年 7月随笔档案 - 桃乐丝

摘要：对于这样的文本，要取到￥168这个值： <td class="total"><span class="money">¥</span>168</td> 注意：sub返回的不是list，而是字符串阅读全文

posted @ 2017-07-18 09:41 桃乐丝阅读(270) 评论(0) 推荐(0)

摘要：对于网页爬取结果为json格式的，可以直接使用python的json库解析，获取相应字段的值，比用正则匹配更简单规范。阅读全文

posted @ 2017-07-13 09:38 桃乐丝阅读(288) 评论(0) 推荐(0)

摘要：使用python的requests库爬取网页时，获取文本一般使用text方法，如果要获取图片并保存要用content 举个栗子，爬煎蛋网的图：考虑到如果图片很大，获取需要时间，设置timeout超时避免内容取不完整。写文件内容为r_img.content 打开文件的方式使用wb+，二进制文件覆盖阅读全文

posted @ 2017-07-13 09:30 桃乐丝阅读(323) 评论(0) 推荐(0)

笔记本

07 2017 档案

公告