ken桑带你读源码 之scrapy pipelines\images.py
大家先看看 http://www.cnblogs.com/attitudeY/p/7078559.html
下面我做一些补充 最新版本1.1 已经支持 下载路径保存到 item 48行 DEFAULT_IMAGES_RESULT_FIELD = 'images' 作为保存下载地址key
同时我们会有保存 缩略图的情况 setting 增加 IMAGES_THUMBS = {1:(10,20),2;(20:30)} 1 作为 序号 也是保存路径的依据 204行 return 'thumbs/%s/%s.jpg' % (thumb_id, thumb_guid) 后面的 10,20 作为缩略图长宽
小于 最小宽度 min_width or 小于 min_height 会报异常 117 行
if width < self.min_width or height < self.min_height:
raise ImageException("Image too small (%dx%d < %dx%d)" %(width, height, self.min_width, self.min_height))
其中源代码 大量用到 BytesIO 意思把图片处理的中间结果都放在内存中 加快处理速度 最终的文件保存是在 106行
self.store.persist_file (path, buf, info,meta={'width': width, 'height': height},headers={'Content-Type': 'image/jpeg'})
有不懂的欢迎评论 我都耐心解答

浙公网安备 33010602011771号