1、概述

同步化是分布式系统中的一个重要概念。同步化主要解决排序问题。例如，多个线程不能同时操作变量，而是使用锁或无锁结构同步多个线程。同步的目的是将多个线程排序为操作时间序来操作变量。

在单个计算机中，时间是明确的。当过程想要获得时间时，系统调用过程，然后操作系统内核返回时间。然而，在分布式系统中，每台计算机的时钟可能是一致的或不一致的。即使分布式系统中的每台计算机中的时钟是一致的，这个时钟也不是分布式系统的全局。如果不是全局时钟，分布式系统可能会出现问题。

2、物理时钟

计算机中的时钟是物理硬件，通常称为计时器，计算机的计时器通常是石英晶体管。以一定频率振荡石英晶体管。然后两个寄存器与每个石英晶体相连，一个是计数器，另一个是保持寄存器。石英晶体振荡使计数器减1。当计数器为0时，会产生中断，然后计数器将初始值重新安装在保持寄存器中。计数器产生的中断称为时钟滴答。当出现中断时，操作系统会响应中断，并调用中断处理程序将时钟存储器中的值加1。

时钟中断示意图(图片来自网络-示意图显示增加1): 在这里插入图片描述

2.1.物理时钟问题

一句话总结：单台计算使用物理使用没有问题，分布式系统中各个进程使用物理时钟大概率不准确从而造成问题。物理时钟在计算中的主要问题是时钟偏移（clock skew）。流行点描述时钟偏移是指时钟摆动的偏移变慢或变快或变慢，导致时钟不同步。

时间偏移基本上不影响同一计算机过程的时间获取，因为即使有时间偏移，不同过程在不同时间获得的时间仍然不同，但分布式系统会有问题。

在分布式系统中，过程分布在不同的计算机上，当每台计算机的时钟偏移时，整个分布式系统中的时钟不同步。如果整个分布式系统中的时钟不同步，则依赖时钟同步的程序将出现问题。

时钟同步算法是解决物理时钟不同步的主要方法。这些算法包括但不限于：网络时间协议Berkeley算法、Critian算法。

注：即使当前计算机时钟大于标准时间或UTC时间，那么这台计算机的物理时钟也是不会回退的，因为回退会造成很多问题，甚至是致命的问题。通常的解决方案是，如果物理时钟过快，保持寄存器的值就会增加，从而增加时钟的振荡周期；如果物理时钟满，保持寄存器的值就会减少，从而减少时钟的振荡周期；以上都是通过一个过渡期慢慢调整物理时钟，达到标准时间或UTC时间一致的结果。

Berkeley 算法适用于无线电时钟（radio clock）对于不可用的分布式系统，该系统无法知道真实时间，只能平均时间作为标准时间。时间服务器将定期从每个客户端获取时间，平均处理后，将每个客户端的时间和平均时间的偏移传回，以达到统一使用这个平均时间的目的。该算法适用于时间不一致、时钟速率不一致的系统。如果客户端时间偏移过大，超过容忍值，平均时间的计算通常不参与。如此可以防止系统的时间被单个异常的时钟过度影响。

Berkeley时钟同步算法图：

2.物理时钟同步-Cristian 算法

3、逻辑时钟

逻辑时钟的焦点在顺序上是一致的，这个时间不一定与实际时间相同。关键是时钟完全一致太复杂了，所以人们提出了逻辑时钟；如果物理时钟完全一致，则不需要逻辑时钟。

3.1、Lamport逻辑时钟

Lamport逻辑时钟是一个happens-before关系，happens-before意思是先发生（happens-before在Java/go内存模型也在使用）。happens-before关系使用表达式：a->b表示读作“a发生在b之前，这意味着所有过程都同意事件a先发生，然后事件b发生。 Lamport提出逻辑时钟是为了解决分布式系统中的时序问题，即如何定义ab之前发生。