> 文章列表 > 单机/集群/热备/磁盘阵列(RAID)的区别详解

单机/集群/热备/磁盘阵列(RAID)的区别详解

单机/集群/热备/磁盘阵列(RAID)的区别详解

一、单机部署(stand-alone)

单个服务器,只有一个饮水机提供服务,服务只部署一份。 

二、集群部署(cluster)

服务器集群就是指将很多服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能正常运行。

有多个饮水机同时提供服务,服务冗余部署,每个冗余的服务都对外提供服务,一个服务挂掉时依然可用

服务器集群分为以下这些类型:

  • 计算集群:服务器计算集群通常被用于承载计算密集型任务,而并不用于 I/O 密集型的应用场景(例如 Web 服务或者数据库)。这类计算集群是以并行计算为基础的,它对外而言就好像是一台性能强大的超级计算机。计算集群又可根据其中节点之间耦合的紧密程度做更进一步的细分。例如,如果某个计算任务需要在节点之间进行频繁的通信,那么这意味着节点之间最好由专用的网络进行连接,而且集群密度可能很高以尽量减少通信开销。实现这类场景通常使用 Beowulf 这样的高性能计算集群;而与之相对应的,如果某个计算任务只需使用较少的服务器节点,或者在服务器之间几乎没有通信的需求,则可以使用网格计算集群实现。

  • 负载均衡集群:负载均衡集群的关键在于能够使多台彼此互联的服务器共同分担计算任务,即任务负载可以在集群中被尽可能地平均分配到多台服务器上处理,从而避免出现集群中某几台服务器超载而其他服务器闲置的情况,有效地改善集群性能。

  • 高可用集群:高可用集群中的部分服务器发生故障时,集群管理系统将及时发现故障并将由该部分承载的任务重新分派到其他正常工作的服务器上。其关键在于能够在系统高速运行的过程中尽可能快速地对系统故障做出响应。为了实现这一点,集群通常会在多台服务器运行冗余节点和服务,并用来互相跟踪,例如通过心跳(heartbeat)机制探知服务器的工作状态。如果侦测到某个服务器节点发生失效,那么其替补者会在非常短的时间内取代它。因此,对于用户而言,高可用集群永远不会停机。

  • 高性能和集群存储:高性能群集由连接到同一网络以执行任务的许多计算机组成。高性能集群连接到数据存储集群,并共同组成一个复杂的体系结构,可以极其快速地处理数据。存储和网络组件必须彼此保持同步,以实现无缝性能和高速数据传输。高性能群集也称为超级计算机,不像高可用性群集和负载平衡群集那样常见,但是用于资源密集型工作负载的企业可以使用它们来提高性能,容量和可靠性。它们被广泛用于 IoT(物联网)和 AI 技术,因为它们促进了诸如实时流,风暴预测或患者诊断等项目的创新,并提供了实时数据处理。它们被大量部署在研究实验室,媒体和娱乐以及金融行业以及许多其他行业中。

  • 集群存储:群集存储由至少两个扩展性能,节点空间 I/O(输入 / 输出)和可靠性的存储服务器组成。根据业务需求和存储需求,可以在紧密耦合的体系结构中针对主存储部署数据存储,并且可以将数据分为节点之间的很小的块,或者在独立的松散耦合结构中不存储数据跨节点,并提供更大的灵活性。在松散耦合的体系结构中,性能和容量受限于存储数据的节点的功能。与紧密耦合的体系结构不同,在此设置中,不能选择具有新节点的可伸缩性。

三、热备部署(hot-swap)

热备(hot-swap)就是将两个相同的工程集中起来提供同一种服务,这些单个的工程就是集群的节点(node)。在这个基础上,以其中一个节点作为响应前端请求的节点(active node),另一个节点作为工程的备份节点(standby node),避免单机不可用导致系统停止造成的损失(业务中断、数据/模板丢失),并且在 active 节点出现问题时,代替其返回前端的请求,确保系统 7*24h 稳定运行的集群。

只有一个桶提供服务,另一个桶stand-by,在水用完时自动热替换,服务冗余部署,只有一个主服务对外提供服务,影子服务在主服务挂掉时顶上

3.2  热备特点

1)高可用性

  • 一主一备模式,主节点宕机后集群系统仍可正常提供服务。

  • 主节点宕机后,自动切换备节点,已登录的用户无需重新登录。

2)高一致性

  • 各节点间平台配置信息和资源文件修改更新能够实时同步。

  • 对于节点间 JAR 包不一致情况,启动时可自动检测对比并提醒。

3)强扩展性

基于良好的架构设计,在 FineBI 和 FineReport 进行集成之后,热备集群能够兼容 FineReport 的 web 集群。

4)使用简单

  • 简单可视化配置,80% 的配置都可在平台上完成。

  • 实时监控各节点的运行状态,对于节点宕机、节点间时间不一致等情况可以及时进行提醒。

四、磁盘阵列RAID(Redundant Arrays of independent Disks)

RAID(Redundant Array of Independent Disks)中文简称为独立磁盘冗余磁盘阵列。简单的说,RAID是一种把多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术。

组成磁盘阵列的不同方式称为RAID级别(RAID Levels)。在用户看起来,组成的磁盘组就像是一个硬盘,用户可以对它进行分区,格式化等等。总之,对磁盘阵列的操作与单个硬盘一模一样。不同的是,磁盘阵列的存储速度要比单个硬盘高很多,而且可以提供自动数据备份。数据备份的功能是在用户数据一旦发生损坏后,利用备份信息可以使损坏数据得以恢复,从而保障了用户数据的安全性。

4.1  RAID0

存储性能高的磁盘阵列,又称striping,它的原理是,将连续的数据分散到不同的磁盘上存储,这些不同的磁盘能同时并行存取数据(速度快)这意味着磁盘的连续读写性能成倍增长(随机不变),但是数据会变得十分危险:因为数据被拆分成多份,一旦某块磁盘出现问题,数据将不可恢复。RAID 0 是速度最快的磁盘阵列,同时也是最危险的磁盘阵列。RAID 0 至少需要两块磁盘。

4.2  RAID1

安全性高的磁盘阵列,又称mirror,它的原理是,将数据完全复制到另一个磁盘上,磁盘空间利用率只有50%(冗余,数据安全)。这意味着磁盘的安全性非常高,但同时也是最浪费磁盘空间的。RAID 1 至少需要两块磁盘

4.3  RAID0+1

RAID0和RAID1的综合方案,这也是国企用的比较多的存储方案(速度快,安全性又高,但是很贵)。RAID0+1 综合了 RAID 0 与 RAID 1 的优点,获取连续读写性能的同时,安全性也得到了提升。RAID0+1 至少需要4块磁盘。

4.4  RAID5

RAID0和RAID1的折衷方案,读取速度比较快(不如RAID0,因为多存储了校验位),安全性也很高(可以利用校验位恢复数据),空间利用率也不错(不完全复制,只冗余校验位),这也是互联网公司用的比较多的存储方案。RAID 5 则是将数据与校验码打散于各个磁盘,其中某一块磁盘出现问题,利用其他磁盘也可以进行恢复。并且由于校验码打散于各个磁盘,当磁盘越多时,数据的安全性就越强。同时RAID 5 是使用率最高的磁盘阵列。 RAID 5至少需要3块磁盘。

a为数据,b为校验码,假设有四块磁盘,存放数据方式:
           磁盘:  1           2           3           4
第三组数据:a31       a32       b33       a34    
第二组数据:a21       b22       a23       a24    
第一组数据:b11       a12       a13       a14    
第二块磁盘损坏,第一组数据由b11加a13,a14可以恢复a12;第二组数据完整不需要恢复;第三组数据由b33加a31,a34可以恢复a32。