分布式数据库
基本概念
分布式+数据库
由多个独立实体组成,并且彼此通过网络进行互联的数据库
分布式数据库 | 集中式数据库 | |
---|---|---|
1 | 由位于不同站点的多个数据文件组成 | 由单个中央数据库文件组成 |
2 | 允许多个用户访问和操作数据 | 多个用户同时访问同一文件时发生瓶颈问题 |
3 | 从离用户最近的位置快速传送文件 | 文件传递给用户可能需要更长的时间 |
4 | 如果其中一个站点发生故障,数据可以恢复 | 单站点意味着系统发生故障时停机 |
5 | 来自分散数据库的多个文件必须同步 | 在单一的中央系统中更简单的更新和管理数据 |
分布式数据库的核心——数据分片、数据同步
1.数据分片
可以突破中心化数据库单机的容量限制,从而将数据分散到多节点,以更灵活更高效的方式来处理数据
1.水平分片
按行进行数据分隔,数据被切割为一个个数据组,分散到不同节点上
2. 垂直分片
按列进行数据切割,一个数据表的模式(schema)被切割为多个小的模块
2.数据同步
由于数据库理论传统上是建立在单机数据库基础上,而引入分布式理论后,一致性原则被打破。使分布式数据库用起来像正常的数据库,所以数据同步背后的推动力,就是人们对数据一致性的追求。