07 2017 档案
摘要:对于这样的文本,要取到¥168这个值: <td class="total"><span class="money">¥</span>168</td> 注意:sub返回的不是list,而是字符串
阅读全文
摘要:对于网页爬取结果为json格式的,可以直接使用python的json库解析,获取相应字段的值,比用正则匹配更简单规范。
阅读全文
摘要:使用python的requests库爬取网页时,获取文本一般使用text方法,如果要获取图片并保存要用content 举个栗子,爬煎蛋网的图: 考虑到如果图片很大,获取需要时间,设置timeout超时避免内容取不完整。 写文件内容为r_img.content 打开文件的方式使用wb+,二进制文件覆盖
阅读全文

浙公网安备 33010602011771号