SolrCloud-5.2.1 集群部署及测试

一. 说明

  Solr5内置了Jetty服务,所以不用安装部署到Tomcat了,网上部署Tomcat的资料太泛滥了。

  部署前的准备工作:

  1. 将各主机IP配置为静态IP(保证各主机可以正常通信,为避免过多的网络传输,建议在同一网段)。

  2. 修改主机名,配置各主机映射;修改hosts文件,加入各主机IP和主机名的映射。

  3. 开放相应端口或者直接关闭防火墙。

  4. 保证Zookeeper集群服务正常运行。Zookeeper的部署参考:http://www.cnblogs.com/wxisme/p/5178211.html

  5. root权限

  6.相关参数和组件的说明:

  Collection:在SolrCloud集群中逻辑意义上的完整的索引。它常常被划分为一个或多个Shard,它们使用相同的Config Set。如果Shard数超过一个,它就是分布式索引,SolrCloud让你通过Collection名称引用它,而不需要关心分布式检索时需要使用的和Shard相关参数。

  Core:也就是Solr Core,一个Solr中包含一个或者多个Solr Core,每个Solr Core可以独立提供索引和查询功能,每个Solr Core对应一个索引或者Collection的Shard,Solr Core的提出是为了增加管理灵活性和共用资源。在SolrCloud中有个不同点是它使用的配置是在Zookeeper中的,传统的Solr core的配置文件是在磁盘上的配置目录中。

  Leader:赢得选举的Shard replicas。每个Shard有多个Replicas,这几个Replicas需要选举来确定一个Leader。选举可以发生在任何时间,但是通常他们仅在某个Solr实例发生故障时才会触发。当索引documents时,SolrCloud会传递它们到此Shard对应的leader,leader再分发它们到全部Shard的replicas。

  Replica:Shard的一个拷贝。每个Replica存在于Solr的一个Core中。一个命名为“test”的collection以numShards=1创建,并且指定replicationFactor设置为2,这会产生2个replicas,也就是对应会有2个Core,每个在不同的机器或者Solr实例。一个会被命名为test_shard1_replica1,另一个命名为test_shard1_replica2。它们中的一个会被选举为Leader。

  Shard:Collection的逻辑分片。每个Shard被化成一个或者多个replicas,通过选举确定哪个是Leader。

二. 安装过程

  1. 到Apache官网下载Solr-5.2.1安装包

  2. 进入到Solr文件的目录,执行以下命令从压缩包中抽出安装脚本:

tar -xvzf solr-5.2.1.tgz solr-5.2.1/bin/install_solr_service.sh --strip-components=2

  3. 运行安装脚本

  执行以下命令安装Solr:

./install_solr_service.sh solr-5.2.1.tgz -i /usr/solr/solr5 -d /usr/solr/solr5 -u solr -s solr -p 8983

  或者执行以下命令按照默认值安装:

./install_solr_service.sh solr-5.2.1.tgz

  其实也可以直接解压安装包,然后自定义配置即可。

  4.修改配置

  执行以下命令编辑solr.in.sh文件:

vim /usr/solr5/solr.in.sh

  参照如下进行修改:

SOLR_JAVA_MEM="-Xms1G -Xmx1G"
ZK_HOST="node1:2181,node2:2181,node3:2181/solr"

  内存限制可以按照需要设定。

  5.按照上述步骤在其他节点执行安装

三. 启动Solr服务并验证

  1. 在Solr集群中各节点执行以下命令启动Solr服务:

service solr start

   

  2.查看Solr状态

service solr status

  

  3.登录Solr UI

http://node1:8983/solr

 

 

四. 测试Solr

  Solr提供了几种常用的方式来操作,Shell命令、REST API、SolrJ接口等等,根据实际情况选择。下面的操作为了简单方便的演示使用Shell命令的方式。

  1. 打开并编辑server/solr/configsets/sample_techproducts_configs/conf下的schema.xml文件,在文件末尾随便添加一个field。

 

  2. 创建一个collection并上传关联配置文件至Zookeeper。

./bin/solr create_collection -c students -d server/solr/configsets/sample_techproducts_configs/conf -shards 3 -replicationFactor 3

 

  如果以后要更新配置文件到Zookeeper,可以使用以下命令更新全部配置:

./server/scripts/cloud-scripts/zkcli.sh -zkhost node2:2181,node1:2181,node3:2181 -cmd upconfig -confname students -confdir server/solr/configsets/sample_techproducts_configs/conf

 

  如果只更新单个文件使用putfile命令:

./server/scripts/cloud-scripts/zkcli.sh -zkhost node2:2181,node1:2181,node3:2181 -cmd putfile /solr/configs/students/schema.xml /usr/tempfiles/schema.xml

 

  路径的前者为配置文件在Zookeeper中的存储路径,后者是配置文件的本地路径。需要注意的是如果Zookeeper中的这个文件存在需要先删除之,然后在上传更新。可以登录Zookeeper中操作:

ZK_HOME/./bin/zkCli.sh -timeout 5000 -server node3:2181

 

   登录到Zookeeper之后可以使用命令来对配置文件删除以及其他的操作,如果不清楚配置文件在Zookeeper中的位置也可以查看。

  3.检测collection是否成功创建,在Solr UI中刷新页面,点击Cloud如果成功创建了Collection会显示出Solr的集群拓扑。

  还可以查看定义的schema.xml是否生效

 

 

 

  4.添加索引,查询数据

  1.添加索引数据可以使用上述的几种方式,为简单起见使用Solr UI添加简单的索引数据进行测试

  点击提交会返回成功的信息:

 

 

 

  2.查询测试

 

 

  测试完之后可以删除Collection

http://node1:8983/solr/admin/collections?action=DELETE&name=students

 

  到此Solr的部署和简单的测试就完成了,接下来就可以深入学习Solr的工作原理、数据结构的定义、配置和查询了。

 

  参考资料:Solr官方文档

 

posted @ 2016-02-04 10:50 Pickle 阅读(...) 评论(...) 编辑 收藏