摘要:
对于网页爬取结果为json格式的,可以直接使用python的json库解析,获取相应字段的值,比用正则匹配更简单规范。 阅读全文
posted @ 2017-07-13 09:38
桃乐丝
阅读(289)
评论(0)
推荐(0)
摘要:
使用python的requests库爬取网页时,获取文本一般使用text方法,如果要获取图片并保存要用content 举个栗子,爬煎蛋网的图: 考虑到如果图片很大,获取需要时间,设置timeout超时避免内容取不完整。 写文件内容为r_img.content 打开文件的方式使用wb+,二进制文件覆盖 阅读全文
posted @ 2017-07-13 09:30
桃乐丝
阅读(324)
评论(0)
推荐(0)

浙公网安备 33010602011771号