摘要:
d: 进入D盘 scrapy startproject GitHub 创建项目 scrapy genspider github github.com 创建爬虫 编辑github.py: 新建debug.py调试脚本: 修改settings.py配置文件: 第23行修改为: 阅读全文
摘要:
d:进入D盘scrapy startproject douban创建豆瓣项目cd douban进入项目scrapy genspider douban_spider movie.douban.com创建爬虫 编辑items.py: 编辑douban_spider.py: 新建MySQLPipline. 阅读全文
摘要:
D:进入D盘 scrapy startproject cnblogs创建博客园项目 cd cnblogs进入项目根目录 scrapy genspider blog cnblogs.com创建爬虫文件 blog.py: scrapy crawl blog运行爬虫 首页展示的20条博客的标题和作者: 爬 阅读全文
摘要:
d:进入D盘 scrapy startproject tutorial建立一个新的Scrapy项目 cd tutorial 进入项目路径 scrapy genspider quotes toscrape.com 建立一个新的爬虫 工程的目录结构: tutorial/ scrapy.cfg # 部署配 阅读全文
摘要:
Windows怎样安装Scrapy? pip install scrapy会报错 访问https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted 下载并放到D盘 pip install D:\Twisted-18.4.0-cp36-cp36m-win_am 阅读全文
摘要:
官网 https://goaccess.io/ yum -y install glib2 glib2-devel ncurses ncurses-devel GeoIP GeoIP-devel安装依赖 wget http://tar.goaccess.io/goaccess-1.3.tar.gz下载 阅读全文
摘要:
docker create --name test_4 -v /data_4 nginx创建一个test_4数据卷容器,在该容器的/data_4目录挂载数据卷 使用数据卷容器时,无须保证数据卷容器处于运行状态,所以用docker create命令即可。 docker inspect test_4查看 阅读全文
摘要:
当程序在容器中运行时,需要与其他容器中的程序或者容器外部的程序进行文件读写操作时,就需要进行数据的交换;容器内部的文件系统,是一个临时层,当容器停止运行并被删除时,这个临时层就会被一同丢弃;为了达到从外部获取文件并且持久化存储的目的,Docker提供了数据卷;数据卷是一个从外部挂载在容器内文件系统的 阅读全文
摘要:
容器是镜像的一个运行实例,是基于镜像运行的轻量级环境,是一个或者一组应用。 怎样创建容器?将容器所基于的镜像名称传入即可,Docker会从本地仓库中寻找该镜像,如果本地仓库没有,则会自动从远程仓库中拉取。 docker pull nginx拉取nginx最新版本的镜像 docker images查看 阅读全文
摘要:
docker pull registry拉取registry镜像 docker images查看镜像 docker run -d -p 5000:5000 -v /opt/data/registry:/tmp/registry registry启动容器 Registry服务默认将仓库存放于容器内的/ 阅读全文