随笔分类 - python
尽管java很美好,但还是不愿意被禁锢在单一的世界里,故而学习python
摘要:按照教程,pip install jupyter 总是报错。红字没能记录下来,大概是说MarkupSafe安装失败。 解决方案: pip install setuptools==23.2.1 pip install jupyter https://www.zhihu.com/question/483
阅读全文
摘要:往往需要爬取的网页是呈一个树状结构。比如,需要先爬取一个目录,然后再在目录中选择具体的爬取目标。而目录和具体目标之间,网页结构不同,使得我们不能使用相同的爬取策略。 从之前的经验来看,我们对scrapy进行操作是从Spider的Parse()函数作为入口。不如在parse()函数中对对目录进行操作,
阅读全文
摘要:本文是跟着大神博客,尝试从网站上爬一堆东西,一堆你懂得的东西 附上原创链接: http://www.cnblogs.com/qiyeboy/p/5428240.html 基本思路是,查看网页元素,填写xpath表达式,获取信息。自动爬取策略是,找到翻页网页元素,获取新链接地址,执行翻页。网页分析部分
阅读全文
摘要:也许是很少接触python的原因,我觉得是Scrapy框架和以往Java框架很不一样:它真的是个框架。 从表层来看,与Java框架引入jar包、配置xml或.property文件不同,Scrapy的模式是先用Scrapy建立项目,然后对项目中部分文件进行编辑,从而达到爬取相应网页的目的。 控制台->
阅读全文
摘要:学习python爬虫框架scrapy的时候,用到pip管理工具来安装scrapy。最直观的感受,pip有点类似于Ubuntu下的apt-get工具,几行代码,自动下载、安装相关的东西。网上查了一些背景资料。 python的使用过程中经常引入其他包来实现功能,而pip就是一个管理这些包的工具。当前比较
阅读全文
摘要:想学习爬虫,又想了解python语言,有个python高手推荐我看看scrapy。 scrapy是一个python爬虫框架,据说很灵活,网上介绍该框架的信息很多,此处不再赘述。专心记录我自己遇到的问题以及解决方案吧。 给几个链接吧,我是根据这几个东西来尝试学习的: scrapy中文文档(0.24版,
阅读全文

浙公网安备 33010602011771号