一个document并不是简单的包含他的普通数据。同时也包括元数据——关于这个document的信息。有三个元数据是必须的,如下:_index document存储的地方_type document表述的类(class)_id document的唯一标识符_indexindex就像是关系型数据库的d... Read More
posted @ 2014-05-14 21:57 QQ1350995917 Views(412) Comments(0) Diggs(0)
大部分的应用中的大部分的实体类型对象都可以使用key-value被序列化到JSON中。key就是field的name或这property,value是string,number,boolean,另外的对象,数组,或者其他的类型如用string表示的date类型,或者表示地理位置信息的对象。{ "n... Read More
posted @ 2014-05-14 20:41 QQ1350995917 Views(462) Comments(0) Diggs(0)
无论些什么样的程序,其目的都是相同的,用某种方式组织数据以为我们的目的进行服务。但是包含的数据不是随机排列的位或者字节。我们总是把数据构建成能够描述存在于世界的个体。如果我们知道一个名字和一个邮件地址同属于一个人的时候那么这些数据就变得更有意义了。在真是的世界中,并不是所有的看起来很相似的个体都可一... Read More
posted @ 2014-05-14 20:28 QQ1350995917 Views(551) Comments(0) Diggs(0)
我们曾经说过ES能应对node出现故障的事情,那就来试试吧。我们先吧第一个node给干掉,如下图:我们干掉的第一个node是master node。但是为了ES能够正常的工作,一个集群cluster必须要有一个master node,所以,干掉master node后ES首要事情就是重新选择一个no... Read More
posted @ 2014-05-13 21:31 QQ1350995917 Views(246) Comments(0) Diggs(0)
随着数据增长的需求,应该怎么样扩展ES呢?如果开启第三个node,这个cluster就会变成如下如所示:从node1和node2各自移出一个shard到node3中,现在在每个node中有两个shard而不是三个了,这意味着每个node的shared共享了其硬件资源,这样每个shard能达到更好的性... Read More
posted @ 2014-05-13 17:21 QQ1350995917 Views(471) Comments(0) Diggs(0)
运行单独的节点意味着有将会面对单点故障——没有冗余的数据备份。幸运的是我们可以启动另外的node来保护我们的数据。一个新的node,只要他的cluster name和已经存在的cluster节点的名称相同,就会自动加入这个cluster,并且能和其他的node进行通信。增加第二个node之后,clu... Read More
posted @ 2014-05-13 14:29 QQ1350995917 Views(230) Comments(0) Diggs(0)
想ES中存储数据,需要index——存储数据的地方,实际上,index就是一个指向若干物理shard的逻辑命名空间。shard就是更底层的工作单元,每个shard是一个Lucene的实例,每个shard在其控制范围内都是一个完整的搜索引擎。我们的文档被存储,并且被index到shard,但是应用程序... Read More
posted @ 2014-05-12 22:35 QQ1350995917 Views(704) Comments(0) Diggs(0)
在ES中有很多的可被监视的统计数据,其中最重要的是cluster health,cluster health使用green,yellow,red来标记。使用如下请求:GET /_cluster/health在一个没有index的空的cluster中,以上请求返回{ "cluster_name": ... Read More
posted @ 2014-05-12 15:43 QQ1350995917 Views(1558) Comments(0) Diggs(0)
如果启动一个单独的node,没有index,没有data,那么这个cluster就是一个空的node,如图一个node就是一个ES实例,一个cluster包含了若干具有相同cluster.name属性值的node,这些node协同工作,共享数据。当cluster中的node被添加或移除,cluste... Read More
posted @ 2014-05-12 13:28 QQ1350995917 Views(388) Comments(0) Diggs(0)
补充章节:正如前面提到的,这是几个补充章节是有关ES在分布式环境下的操作的,在这几个章节里将要解释常用的术语,像cluster,node,shard,ES的扩展机制和如何处理硬件故障。然而本章节是不需要要求阅读的,即使不用知道什么是shard,replication 和failover也能在很长时间... Read More
posted @ 2014-05-12 11:48 QQ1350995917 Views(191) Comments(0) Diggs(0)