分布式架构

分布式架构

分布式架构之中心化和去中心化

分布式架构之脑裂问题

高可用架构

主从架构
分布式架构

ps：分布式架构容易出现脑裂问题

分布式架构的中心化和去中心化

中心化：只能有一个主节点负责写入操作
- elasticsearch
去中心化：每个主节点都可以负责写入操作
- redis

ps：中心化架构可以使用zookeeper来存储元数据和选举领导者
ps：中心化架构受限于单点的能力
ps：去中心化架构需要频繁的交换信息

节点的角色

主从架构
- master：主（一个），负责干活
- slave：从（多个），负责备用
- sentinel：哨兵（多个），负责监工
分布式架构
- leader：领导者（一个），负责决策
- follower：跟随者（多个），负责备用
- worker：工作者（多个）：负责干活

ps：主从架构中写操作只能由master处理，读操作master和slave都可以处理
ps：分布式架构中写操作只能由leader处理，读操作leader和follower都可以处理

集群和分布式的区别

集群和分布式的区别

单机（Standalone）：一个人干所有的事
集群（Cluster）：多个人轮流干一件事
分布式（Distributed）：多个人分工干一件事

ps：服务是集群（集群对应的是单机），计算和存储是分布式

分布式理论

分布式理论

CAP理论

CAP入门

CAP进阶

CAP详解

CAP之P（分区容错性）是指什么

CAP为什么不能同时满足入门

CAP为什么不能同时满足详解

CAP之为什么要保证P

CAP之可以不保证P吗

CAP之CP和AP对比入门

CAP之CP和AP对比详解

CAP
- C：强一致性：某个时刻读取所有节点的某个数据都是相同的（强一致性，不同于弱一致性和最终一致性）
- A：高可用性：在有限的时间返回数据（不能出现等待延迟或者访问超时的情况）
- P：分区容错性：网络故障出现分区后各个可用分区也能继续对外提供服务（而不是暂停服务去等待网络恢复）

ps：在分布式系统中，因为网络的复杂性，所以一定会出现因为网络故障导致分区的情况，如果此时不保证分区容错性，就意味着允许部分节点不可用导致服务不能提供完整的服务，但是大部分得场景是不能忍受不完整的服务的，所以分布式系统中一般会保证分区容错性

BASE理论

BASE理论入门

BASE理论进阶

BASE理论详解

BASE和ACID理论对比

BASE和CAP理论对比

BASE
- BA：基本可用
- S：软状态（允许有短暂的中间状态）
- E：最终一致性
ACID
- A：原子性
- C：一致性
- I：隔离性
- D：持久性

ps：BASE理论的一致性是最终一致性，而CAP和ACID的一致性是强一致性

分布式算法

分布式算法详解

一致性算法

分布式一致性算法入门

分布式一致性算法进阶

分布式一致性算法详解

分布式强一致性算法
- Paxos
- Raft（Paxos的简化版）
- ZAB（为zookeeper专⻔设计的）
分布式弱一致性算法
- Gossip

一致性hash

分布式hash策略入门

分布式hash策略详解

一致性哈希算法入门

一致性哈希算法进阶

一致性哈希算法详解

一致性哈希算法存在的问题及解决方案

普通hash
一致性hash
hash槽

ps：一致性hash和hash槽能够很好的支持节点的扩容和缩容
ps：节点路由（node route）问题是通过hash算法来解决的
ps：节点故障（node failure）问题则是通过主从架构来解决的

分布式协同

分布式协调服务详解

分布式协调服务选型

一文带你读懂zookeeper在大数据生态的应用

zookeeper入门

zookeeper详解

分布式协同又叫分布式协调

zookeeper能做什么

配置管理
服务管理
命名服务
节点选举
分布式锁

主从选举

数据同步

元信息同步
- 加入集群通知
- 离开集群通知
- 主节点选举
健康状态同步

分布式计算

分布式计算模型

fork-join
partition-merge

分布式计算框架

分布式存储

replication（复制）
shard（分片）
replica（副本）

分布式应用

分布式ID

生成唯一id的方案入门

生成唯一id的方案进阶

生成唯一id的方案详解

生成唯一id的方案对比入门

生成唯一id的方案对比详解

生成唯一的long型数字id

唯一标识生成器又叫发号器

唯一标识来源

业务id（身份证号、手机号、设备指纹）
逻辑id（发号器生成）
- 顺序id
- 随机id

唯一标识实现

单机
- 顺序id
  - mysql自增id
  - 时间戳
- 随机id
  - UUID
分布式
- 顺序id
  - mysql发号器
  - redis发号器
- 随机id
  - UUID
  - SnowflakeId
  - MongodbId

Timestamp

使用时间戳生成单进程唯一ID入门

使用时间戳生成单进程唯一ID进阶

使用时间戳生成单进程唯一ID详解

UUID

UUID入门

UUID详解

UUID之生成方案入门

UUID之生成方案详解

UUID之生成短UUID

UUID会重复吗入门

UUID会重复吗详解

UUID会重复吗之去掉短横杠

UUID之Mac地址对黑客有什么用

为什么NanoID会取代UUID

UUID有128位，由32个的16进制数字组成，形式为 8-4-4-4-12 的32个字符（算上短横杠的话有36个字符）

UUID的重复性

版本1和2：可能会重复（因为依赖的时间戳、随机数和MAC地址可能会重复）
版本3和5：同名的相同，不同名的不相同
版本4：可能会重复（因为依赖的随机数可能会重复）

ps：当使用虚拟机和容器时MAC地址可能会重复

Snowflake

Snowflake ID入门

Snowflake ID进阶

Snowflake ID详解

Snowflake ID之UidGenerator详解

Snowflake ID之Leaf详解

Snowflake ID重复问题入门

Snowflake ID重复问题进阶

Snowflake ID重复问题详解

Snowflake ID之如何解决时钟回拨的问题

Snowflake ID之UidGenerator如何解决时钟回拨的问题

Snowflake ID之Leaf如何解决时钟回拨的问题

Snowflake ID之动态生成workerId

Snowflake ID之感受一下性能高出587倍的全局唯一ID生成算法

SnowflakeId：1（符号位） + 41（时间戳） + 10（workerId） + 12（offset）

ps：workerId = 5（machineId） + 5（datacenterId）
ps：时间戳是一个偏移量不一定要从 1970-1-1 开始，可以从第一次上线时间开始
ps：可以按照实际需求做调整，比如增加时间戳或者偏移量的位数

workerId生成方案
- machineId + datacenterId
- redis自增
machineId生成方案
- hostname（简单，固定，需要注意检查是不是localhost）
- ip（复杂，可能会变，需要注意排除localhost和虚拟机ip）
datacenterId生成方案
- redis自增

如何解决时钟回拨

UidGenerator
- 每次启动时生成新的机器id
- 运行时检测到时钟回拨则抛出异常
Leaf
- 运行时检测到时钟回拨则阻塞等待直到时间到达

Mysql

Mysql生成全局唯一ID

Redis

Redis生成全局唯一ID

MongoDB

MongoDB ID入门

MongoDB ID详解

MongodbId：4byte时间戳 + 3byte机器哈希 + 2byte进程id + 3byte自增计数
SnowflakeId：1（符号位） + 41（时间戳） + 10（workerId） + 12（offset）

Docker

Docker环境下分布式ID重复的问题

分布式锁

分布式锁详解

分布式事务

分布式事务详解

分布式事务框架

分布式事务方案

分布式事务之2PC和3PC

分布式事务之TCC

分布式事务之3PC和2PC的区别

分布式事务之TCC和2PC

分布式事务之常见问题

分布式事务之补偿机制

分布式事务之事务消息

事务的分类

本地事务（ACID理论）
- 2PC
- 3PC
分布式事务
- 刚性事务（CAP理论、强一致性）
  - 2PC（Seata-XA/AT）
  - 3PC（Seata-XA/AT）
- 柔性事务（BASE理论，最终一致性）
  - 补偿型
    - TCC（Seata-TCC）
    - SAGA（Seata-SAGA）
  - 通知型
    - 本地消息表
    - MQ事务消息
    - 最大努力通知

ps：XA/AT是通用的事务协议（AT是高性能版的XA），JTA和JTS是Java的事务协议
ps：TCC和2PC的流程相似，TCC适用于业务系统，2PC适用于存储系统
ps：最大努力通知也称定期校对，是对MQ事务方案的进一步优化，它在事务主动方增加了消息校对的接口，如果事务被动方没有接收到主动方发送的消息，此时可以调用事务主动方提供的消息校对的接口主动获取没有处理完成的消息

事务的概念

TX：应用程序与事务管理器之间的接口协议
XA：事务管理器与资源管理器之间的接口协议
AP：应用程序
RM：资源管理器
TM：事务管理器
2PC：Prepare、Commit、Rollback，两阶段提交（Two-Phrase-Commit）
3PC：Can、Prepare、Commit、Rollback，三阶段提交（Three-Phrase-Commit）
TCC：Try、Confirm、Cancel，两阶段提交（Two-Phrase-Commit）

ps：XA规范是X/Open组织定义的分布式事务处理（DTP，Distributed Transaction Processing）标准

事务的流程

本地消息表

本地消息表使用了两阶段提交的思想来保证本地事务和事务消息的一致性

事务主动方写业务表
事务主动方写消息表
事务主动方发送事务执行消息
事务被动方消费事务执行消息
事务被动方写业务表
事务被动方发送事务结果消息
事务主动方消费事务结果消息
事务主动方更新消息表的状态

ps：如果事务被动方执行成功，可以发成功消息让事务主动方提交
ps：如果事务被动方执行失败，可以发失败消息让事务主动方回滚

失败时的相关处理

第1步和第2步失败，事务主动方直接回滚本地事务就行了
其他步骤失败，事务主动方根据消息表状态重发就行了

MQ事务消息

MQ事务消息使用了两阶段提交的思想来保证本地事务和事务消息的一致性

事务主动方在事务执行前发送半消息（半消息对消费者不可见）
事务主动方执行事务
事务主动方在事务执行后发送事务消息

事务执行成功发送提交消息
事务执行失败发送回滚消息

失败时的相关处理

第1步失败，事务主动方重发就行了
第2步失败，事务主动方回滚就行了
第3步失败
- 1. MQ发起回查消息
- 1. 事务主动方检查事务状态并重发就行了

事务的问题

2PC的问题

性能问题：参与者获取被占用的资源时会被阻塞
协调问题：协调者挂掉后参与者不会释放占用的资源
网络问题
- 部分执行问题：因为网络问题导致只有部分参与者收到了Commit或者Rollback请求
- 重复执行问题：因为网络问题导致参与者重复收到了Commit或者Rollback请求
- 空回滚问题：因为网络问题导致Prepare丢失或者Prepare晚于Rollback达到，使得还没有执行过Prepare就执行Rollback

ps：问题的关键字：性能、协调、网络
ps：协调者有超时机制，参与者没有超时机制

3PC的问题

网络问题
- 部分执行问题：因为网络问题导致只有部分参与者收到了提交或者回滚请求
- 重复执行问题：因为网络问题导致参与者重复收到了提交或者回滚请求
- 空回滚问题：因为网络问题导致Prepare丢失或者Prepare晚于Rollback达到，使得还没有执行过Prepare就执行Rollback

ps：3PC新增了can阶段来判断是否能够执行事务从而减少了事务失败时的阻塞时间
ps：3PC新增了参与者超时机制来避免协调者挂掉后参与者不会释放占用的资源的问题

TCC的问题

每个操作都需要支持额外的确认和取消操作
每个操作都需要支持幂等
网络问题
- 部分执行问题：因为网络问题导致只有部分参与者收到了Confirm或者Cancel请求
- 重复执行问题：因为网络问题导致参与者重复收到了Confirm或者Cancel请求
- 空回滚问题：因为网络问题导致Try丢失或者Try晚于Cancel达到，使得还没有执行过Try就执行Cancel

事务的补偿

回滚
重试

分布式问题

网络问题

脑裂问题

脑裂问题入门

脑裂问题进阶

脑裂问题详解

时钟问题

分布式系统时钟问题入门

分布式系统时钟问题进阶

分布式系统时钟问题详解

时钟回拨

分布式系统时钟回拨问题入门

分布式系统时钟回拨问题进阶

分布式系统时钟回拨问题详解

时钟同步

分布式系统时钟同步问题入门

分布式系统时钟同步问题进阶

分布式系统时钟同步问题详解

Hadoop之时钟同步问题入门

Hadoop之时钟同步问题详解

时钟同步的重要性

时钟同步算法

数据问题

数据倾斜

数据倾斜入门

数据倾斜进阶

数据倾斜详解

分布式架构

集群和分布式的区别

分布式理论

CAP理论

BASE理论

分布式算法

一致性算法

一致性hash

分布式协同

主从选举

数据同步

分布式计算

分布式计算模型

分布式计算框架

分布式存储

分布式应用

分布式ID

Timestamp

UUID

Snowflake

Mysql

Redis

MongoDB

Docker

分布式锁

分布式事务

事务的分类

事务的概念

事务的流程

本地消息表

MQ事务消息

事务的问题

2PC的问题

3PC的问题

TCC的问题

事务的补偿

分布式问题

网络问题

脑裂问题

时钟问题

时钟回拨

时钟同步

数据问题

数据倾斜

分布式综合