如何部署Scrapy 到Scrapyd上?

安装上传工具

 

1、上传工具

scrapyd-client

 

2、安装方法:

pip install scrapyd-client

 

3、上传方法:

python d:\Python27\Scripts\scrapyd-deploy target -p project

注:

target -- 主机地址,如localhost;

project -- 工程名,如stock_uc;

 

4、前提:

①假设python安装位置d:\Python27\

②需进入工程目录下执行上传命令;

③可选参数:

--version r03,即:

python d:\Python27\Scripts\scrapyd-deploy target -p project --version r03

 

安装调度工具curl

1Linux系统

一般情况下Linux系统自带curl工具,如果没有请百度安装方法;

 

2Windows系统

1、下载地址:

链接:http://pan.baidu.com/s/1mgy9zVq

密码:4lqh

 

2、安装方法:

 1)解压下载的文件夹,比如解压后的位置E:\bin-curl

 2)添加解压后的文件夹路径到环境变量Path中,比如:   D:\Python27\;D:\Python27\Scripts\;E:\bin-curl\;***

 3)重启电脑是环境变量生效;

 4)测试,运行:curl --help 查看帮助信息;

 

调度爬虫

1、添加版本信息

curl http://localhost:6800/addversion.json -F project=myproject -F       version=r23 -F egg=@myproject.egg

 

2、调度spider执行

curl http://localhost:6800/schedule.json -d project=myproject -d    spider=somespider

 

3、取消spider的执行

curl http://localhost:6800/cancel.json -d project=myproject -d      job=6487ec79947edab326d6db28a2d8651

 

4、列出工程 

curl http://localhost:6800/listprojects.json

 

5、如何启动scrapyd,以及如何把一个现有的工程部署到scrapyd上面:

第一步:输入scrapyd,敲击enter,等待:

 

第二步:在这个服务器上部署工程,具体方法前面已经提到过

第三步:调度spider

第四步:取消

第五步:列出工程

 

总结

1,能正确安装scrapyd-client;

2,能够正确安装curl

3,学会project的上传和spider的调度;

 

文章来源:麦子学院

原文链接:http://www.maiziedu.com/wiki/crawler/deploy/

posted @ 2016-09-19 18:23  程序猿终结者  阅读(...)  评论(...编辑  收藏