文章分类 - scrapy
scrapy源码系列之Item
摘要:以下以及后续所有的源码都是基于scrapy1.0.2,并且会涉及到一些python基础和模块。scrapystartprojectspiderpoject生成一个工程,整个目录结构如下图。item.py用来定义数据模型,每个item是继承scrapy.Item,查看scrapy/item.py@si...
阅读全文
scrapy使用经验总结
摘要:接着上一篇继续聊scrapy。断断续续的使用scrapy已经很长时间,在各种问题也算是有所领悟(所需工具firefox,firebug,firefox的xpath插件)。1.非标准的html解析问题(上一篇提到过),这个问题蛋疼不是问题有多难解决,而是很难定位到错误的原因。在firefox中确保xp...
阅读全文
浙公网安备 33010602011771号