分布式系统中的时钟：逻辑时钟与向量时钟

为了同步logical clocks，Lamport 定义了一个关系叫做happens-before.记作 ->

a->b意味着所有的进程都agree事件a发生在事件b之前。

在两种情况下，可以很容易的得到这个关系：

1 如果事件a和事件b是同一个进程中的并且事件a发生在事件b前面，那么a->b

2 如果进程A发送一条消息m给进程B，a代表进程A发送消息m的事件，b代表进程B接收消息m的事件，那么a->b(由于消息的传递需要时间)

happens-before 关系满足传递性：即(a->b && b->c)->(a->c)

如果事件a和事件b发生在不同的进程，并且这两个进程没有传递消息，那么既不能推到a->b也不能推到b->a，这样的两个事件叫做并发事件

现在需要定义一个事件的函数C，使得[a->b]->[C(a)<C(b)]，并且由于是作为一种对时间的衡量，所以C也必须是只增不减的。

Lamport 算法

三个机器上各自跑着一个进程，分别为P1，P2，P3，由于不同的机器上的quartz crystal不一样，所以不同的机器上的时钟速率可能是不同的，例如当P1所在

的机器tick了6次，P2所在的机器tick了8次。

图中，P1给P2发送了消息m1，m1上附带了发送m1时的时钟6，随后P2收到了m1，根据P2接收到m1时的时钟，认为传输消息花了16-6=10个tick

随后，P3给P2发送消息m3，m3附带的发送时钟是60，由于P2的时钟走的比P3的慢，所以接收到m3时，本机的时钟56比发送时钟60小。这是不合理的，需要调整时钟，

如图中，将P2的56调整为61，即m3的发送时钟加1

Lamport logical clocks的实现：

每个进程Pi维护一个本地计数器Ci，相当于logical clocks，按照以下的规则更新Ci

1 每次执行一个事件(例如通过网络发送消息，或者将消息交给应用层，或者其它的一些内部事件)之前，将Ci加1

2 当Pi发送消息m给Pj的时候，在消息m上附着上Ci

3 当接收进程Pj接收到Pi的发送的消息时，更新自己的Cj = max{Cj,Ci}

Lamport logical clocks可以保证(a->b)->( C(a)<C(b) )，但是不能保证( C(a)<C(b) )->(a->b)

也就是说，Lamport logical clocks的问题是：事件a和事件b实际发生的先后顺序不能仅仅通过比较C(a)和C(b)来决定。

这是因为Lamport logical clocks没有capture causality(因果关系)，而causality可以通过Vector Clocks来capture。向量时钟实际是一组版本号（版本号=逻辑时钟)，假设数据需要存放3

份，需要3台db存储（用A，B，C表示），那么向量维度就是3，每个db有一个版本号，从0开始，这样就形成了一个向量版本 [A:0, B:0, C:0];

初始状态下，所有机器都是 [A:0, B:0, C:0]；

DB_A——> [A:0, B:0, C:0]

DB_B——> [A:0, B:0, C:0]

DB_C——> [A:0, B:0, C:0]

这样既可以保证(a->b)->( C(a)<C(b) )，又能保证( C(a)<C(b) )->(a->b)。

用VC(a)来表示事件a的Vector Clock，有如下性质：VC(a) < VC(b)可以推出事件a causally 发生在事件b之前(也就是事件a发生在事件b之前)。

为每个进程Pi维护一个向量VC，也就是Pi的Vector Clock，这个向量VC有如下属性：

1 VC_i[i] 是到目前为止进程P_i上发生的事件的个数

2 VC_i[k] 是进程Pi知道的进程P_k发生的事件的个数(即P_i对P_j的知识)

每个进程的VC可以通过以下规则进行维护(和Lamport logical clocks算法类似)：

1 进程P_i每次执行一个事件之前，将VC_i[i]加1

2 当P_i发送消息m给P_j的时候，在消息m上附着上VC_i(进程P_i的向量时钟)

3 当接收进程P_j接收到P_i的发送的消息时，更新自己的VC_j[k] = max{VC_j[k],VC_i[k]} ，对于所有的k

以上两种都是分布式时钟的表示方式，在很多地方都可以用到。比如全序多播（totally ordered multicasting）中对向量时钟添加约束条件则成为一种比较好的一致性达成方式。

posted @ 2017-08-28 23:29 小天儿阅读(4857) 评论(3) 收藏举报

刷新页面返回顶部

技术解剖手