搜档网
当前位置:搜档网 › NetApp统一存储双活实施方案

NetApp统一存储双活实施方案

NetApp统一存储双活实施方案
NetApp统一存储双活实施方案

NetApp统一存储双活方案

————————————————————————————————作者:————————————————————————————————日期:

NetAp统一存储双活

方案

NetApp统一存储双活方案

1、双活存储架构建设目标

系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间(不可忍受)的事故。可能引发系统灾难的因素包括:?系统软、硬件故障,如:软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等;

?机房环境突发性事故,如:电源中断、建筑物倒塌、机房内火灾等;

?人为因素,如:因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等;

?自然灾害:如火灾、地震、洪水等突发而且极具破坏性的事故。

其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下,计算中心机房的硬件设备会部分或完全损坏,造成业务的停顿。请参见下图:

当前用户IT系统缺乏有效的灾难防范手段,难以在灾难发生后,不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后,为降低灾难发生后造成的损失,重新组织系统运行,从而保证业务连续性。其目标包括:

●保护数据的完整性、一致性,使业务数据损失最少;

●快速恢复业务系统运行,保持业务的连续性。

灾难恢复的目标一般采用RPO和RTO两个指标衡量。

技术指标RPO、RTO:

RPO (Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。即在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在半同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,同步模式下,RPO一般为0,而在非同

步模式下,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性是不相同的,RPO表示业务数据与容灾备份数据的时间差。换句话说,发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。

RTO (Recovery Time Objective):即应用的恢复时间目标。RTO 主要指的是所能容忍的应用停止服务的最长时间,也是是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金。

各种用户的应用对RTO要求不同,业务繁忙的关键业务需要较小的RTO,如果系统恢复时间过长就会影响到业务运行,而许多业务系统的RTO较长,如果一些较小灾难发生在非业务运行时间,那么对业务连续性几乎不会造成任何影响。各种容灾解决方案的RTO有较大差别,基于光通道技术存储区域网(SAN)的同步数据复制,配合远程备用业务系统和跨生产中心与容灾中心的高可用管理系统,这种容灾解决方案具有最小的RTO。相比较而言,普通磁带备份的RTO较长,当灾难发生时需要更长的时间恢复系统。

2、双活数据中心的价值和特点

双活数据中心技术,是目前业界最高级别的数据保护。如果和传

统容灾技术相比,双活数据中心达到了SHARE 78中最高的Tier 6的所有要求。除此之外,双活数据中心还有以下特点和优势:

?双活数据中心,实际上是跨数据中心的高可用。细分到单个组件

看,形成了跨数据中心的主机高可用、网络高可用和存储高可用,实现的是跨数据中心的应用高可用。

?双活数据中心具有“故障自愈”的特点,不需要人为干预,发生故

障后,应用自动转移到可以正常运行的部分。而应用的运行不会受到影响。即RPO = 0和RTO = 0。这是容灾技术完全不能够比拟的优势。

?不同于容灾技术中“主中心-备中心”的主备概念,双活数据中心具

有“双活”的特点,也就是说,业务可以分担到两个数据中心,同时运行,互为备份。相对于同步容灾,灾备中心设备往往处于空转状态,双活数据中心中的所有硬件资源都得到了重复的利用,避免了投资上的浪费,而网络要求完全是一样的。因此,双活技术不但降低了成本,而且增加了效率。

?双活数据中心的常见架构如下:

?两中心为对等配置

?两中心之间需要低延迟的高带宽链路连接,一般需要裸光纤。xWDM

设备往往被应用来实现链路复用,增加链路利用率

两中心之间为双活互备工作模式

注:双活存储也可部署在同机房,在这种情况下,双活架构对机房整体故障不具备防范能力。

3、NetApp统一存储双活方案概述

结合业界现有的技术和实施经验,我们建议进一步完善和健全现有系统架构,全面提升应用系统可用性,满足业务系统需求:?采用存储级别的镜像技术实现双活数据中心,利用业界领先的技术,实现数据中心级别的高可用,可以有效防范各类物理故

障,包括主机故障、网络故障、存储故障、交换机故障、机房

区域故障(不包括机房整体灾难)等;

?对于逻辑故障,例如数据库损坏、主机逻辑设备故障,可利用新购存储的先进技术,提供快速的恢复手段,实现: ?RPO < 1小时

?RTO < 1小时

?对于误操作造成的部分数据丢失,可利用先进的存储技术,在不中断生产库前提下,迅速从历史备份中恢复丢失数据,消除

对业务的影响。恢复时间可低于1小时。

?在双活存储架构建立后,未来进一步构建灾备系统,从而增强数据的安全性,灾备系统可按降档模式建设,在满足业务要求

的前提下,避免过度投资。

综合以上的建设要点,可以分析得出,新购存储必须具备以下功能和技术特点:

?具备秒级备份和秒级恢复功能,且该功能不影响生产性能

?对于部分数据恢复,可从多个历史备份副本中选择,将备份库以只读打开,选择性地恢复数据

?具备双活数据中心技术,获得第三方机构认证,例如VMware Metro Storage Cluster认证

结合NetApp多年方案经验,我们建议利用统一存储双活技术,构建同机房的应用级双活系统,具体拓扑图如下:

统一存储系统构建双活存储系统,共配置48块600GB 10K SAS 磁盘和48块2TB 7.2K SATA磁盘,详细配置如下:

NetApp MetroCluster双活存储节点A

FAS 6220统一存储

类型模块配置描述

硬件控制器架构

采用SAN + NAS 统一存储架构,与双活存储节点B共同构建MetroCluster双活系统

控制器缓存

每控配置48 GB一级缓存,支持将SSD和闪存卡作为二级缓存

前后端接口

配置*个8 Gb/s FC主机接口、4个10 Gb/s IP主机接口、6个1 Gb/s IP主机接口、4个后端磁盘接口

扩展磁盘柜配置*个24槽位扩展磁盘柜

磁盘

配置24块600 GB 10K RPM SAS磁盘

配置24块2 TB 7.2K RPM SATA磁盘

软件存储效率

配置FlexV ol灵活卷管理软件、瘦供给功能、数据压缩和A-SIS块级重复数据删除功能

高可用性配置多路径I/O软件和MultiStore安全多租户软件

数据保护

支持单磁盘RAID校验、双磁盘RAID校验和镜像保护技术

配置SnapShot秒级快照软件

性能优化配置FlexShare存储性能优化软件

存储管理

配置OnCommand全图形化存储管理软件和Virtual Storage Console管理插件

服务售后服务3年7 x 24小时硬件和软件售后服务

NetApp MetroCluster双活存储节点B

FAS 6220统一存储

类型模块配置描述

硬件控制器架构

采用SAN + NAS 统一存储架构,与双活存储节点A共同构建MetroCluster双活系统

控制器缓存

每控配置*GB一级缓存,支持将SSD和闪存卡作为二级缓存

前后端接口

配置*个* Gb/s FC主机接口、*个10 Gb/s IP主机接口、*个

1 Gb/s IP主机接口、*个后端磁盘接口

扩展磁盘柜配置*个*槽位扩展磁盘柜

磁盘

配置*块* GB 10K RPM SAS磁盘

配置*块*TB 7.2K RPM SATA磁盘

软件存储效率

配置FlexV ol灵活卷管理软件、瘦供给功能、数据压缩和A-SIS块级重复数据删除功能

高可用性配置多路径I/O软件和MultiStore安全多租户软件

数据保护

支持单磁盘RAID校验、双磁盘RAID校验和镜像保护技术

配置SnapShot秒级快照软件

性能优化配置FlexShare存储性能优化软件

存储管理

配置OnCommand全图形化存储管理软件和Virtual Storage Console管理插件

服务售后服务*年7 x 24小时硬件和软件售后服务

双活方案预期效果:

?有效应对各类极端的物理故障:

o双控双活工作方式,不同于传统同步容灾技术中的主-备模式

o控制器和存储网络交换机(FC和以太网)、磁盘扩展柜实现冗余连接

o极强的物理故障防范能力:任何主机、交换机、存储发生故障,业务不会受到影响,或者仅需快速接管,对业务的影响,远远低于同步容灾模式

统一存储双活方案

NetAp统一存储双活 方案

NetApp统一存储双活方案 1、双活存储架构建设目标 系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间(不可忍受)的事故。可能引发系统灾难的因素包括:?系统软、硬件故障,如:软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等; ?机房环境突发性事故,如:电源中断、建筑物倒塌、机房内火灾等; ?人为因素,如:因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等; ?自然灾害:如火灾、地震、洪水等突发而且极具破坏性的事故。 其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下,计算中心机房的硬件设备会部分或完全损坏,造成业务的停顿。请参见下图:

当前用户IT系统缺乏有效的灾难防范手段,难以在灾难发生后,不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后,为降低灾难发生后造成的损失,重新组织系统运行,从而保证业务连续性。其目标包括: ●保护数据的完整性、一致性,使业务数据损失最少; ●快速恢复业务系统运行,保持业务的连续性。 灾难恢复的目标一般采用RPO和RTO两个指标衡量。 技术指标RPO、RTO: RPO (Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。即在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在半同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,同步模式下,RPO一般为0,而在非同步模式下,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性是不相同的,RPO表示业务数据与容灾备份数据的时间差。换句话说,发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。 RTO (Recovery Time Objective):即应用的恢复时间目标。RTO 主要指的是所能容忍的应用停止服务的最长时间,也是是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有

曙光DS800-G25双活数据中心解决方案介绍

曙光DS800-G25 双活数据中心解决案介绍 曙光信息产业股份有限公司

1解决案概述 在信息社会里,数据的重要性已经毋容置疑,作为数据载体的存储阵列,其可靠性更是备受关注。尤其在一些关键应用中,不仅需要单台存储阵列自身保持高可靠性,往往还需要二台存储阵列组成高可靠的系统。一旦其中一台存储阵列发生故障,另一台可以无缝接管业务。这种两台存储都处于运行状态,互为冗余,可相互接管的应用模式一般称之为双活存储。 由于技术上的限制,传统的双活存储案无法由存储阵列自身直接实现,更多的是通过在服务器上增加卷镜像软件,或者通过增加额外的存储虚拟化引擎实现。通过服务器上的卷镜像软件实现的双活存储,实施复杂,对应用业务影响大,而且软件购买成本较高。通过存储虚拟化引擎实现的双活存储,虽然实施难度有一定降低,但存储虚拟化引擎自身会成为性能、可靠性的瓶颈,而且存在兼容性的限制,初次购买和维护成本也不低。 曙光DS800-G25双活数据中心案采用创新技术,可以不需要引入任第三软硬件,直接通过两台DS800-G25存储阵列实现两台存储的双活工作,互为冗余。当其中一台存储发生故障时,可由另一台存储实时接管业务,实现RPO、RTO为0。这是一种简单、高效的新型双活存储技术。

2产品解决案 曙光DS800-G25双活数据中心案由两台存储阵列组成,分别对应存储引擎A、引擎B。存储引擎A 和B上的卷可配置为双活镜像对,中间通过万兆以太网链路进行高速数据同步,数据完全一致。由于采用虚拟卷技术,双活镜像对中的两个卷对外形成一个虚拟卷。对服务器而言,双活镜像对就是可以通过多条路径访问的同一个数据卷,服务器可以同时对双活镜像对中两个卷进行读写访问。组成双活镜像系统的两台存储互为冗余,当其中一台存储阵列发生故障时,可由另一台存储阵列直接接管业务。服务器访问双活存储系统可根据实际需要,选用FC、iSCSI式,服务器访问存储的SAN网络与数据同步的万兆网络相互独立,互不干扰。 组网说明: 1)服务器部署为双机或集群模式,保证服务器层的高可用, 2)存储与服务器之间的连接可以采用FC、iSCSI链路,建议部署交换机进行组网; 3)存储之间的镜像通道采用10GbE链路,每个控制器上配置10GbE IO接口卡,采用光纤交叉直连的式,共需要4根直连光纤; 4)组网拓扑

NetApp统一存储双活方案

NetAp统一存储双活 方案 NetApp统一存储双活方案 1、双活存储架构建设目标 系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间(不可忍受)的事故。可能引发系统灾难的因素包括:?系统软、硬件故障,如:软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等; ?机房环境突发性事故,如:电源中断、建筑物倒塌、机房内火灾等; ?人为因素,如:因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等; ?自然灾害:如火灾、地震、洪水等突发而且极具破坏性的事故。 其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下,计算中心机房的硬件设备会部分或完全损坏,造成业务的停顿。请参见下图:

当前用户IT系统缺乏有效的灾难防范手段,难以在灾难发生后,不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后,为降低灾难发生后造成的损失,重新组织系统运行,从而保证业务连续性。其目标包括: ●保护数据的完整性、一致性,使业务数据损失最少; ●快速恢复业务系统运行,保持业务的连续性。 灾难恢复的目标一般采用RPO和RTO两个指标衡量。 技术指标RPO、RTO: RPO (Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。即在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在半同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,同步模式下,RPO一般为0,而在非同

浪潮双活存储解决方案

浪潮双活存储解决方案 Prepared on 22 November 2020

浪潮数据中心存储双活解决方案 【需求分析】 大数据时代,数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。 传统数据中心存储灾备一般采用主备模式,只有当生产数据中心存储故障后,灾备中心存储才会接管数据访问业务,并且此过程需要手动执行,将灾备中心对应的业务Lun手动激活读写服务;此外,主备数据中心的模式,在正常业务运转情况下,只有主中心发挥作用,备中心的资源一直处于“待命”模式,无法最大程度发挥所有资源的效率。 双活数据中心将是未来数据中心发展的趋势,而存储双活又是数据中心双活的重要基础。 【浪潮存储双活方案设计】 浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建: ?AS8000-M3虚拟卷镜像功能实现: 浪潮AS8000-M3作为异构存储整合的专业设备,可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响,实现业务连续性。 上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图,对于底层的磁盘阵列来说,其使用方式与现在相同,对其内部的磁盘先进行RAID,然后在RAID组上进行逻辑磁盘(LUN)的划分。如上图的例子中,首先对两个阵列的磁盘做RAID5,然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘,同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后,形成了虚拟卷为虚拟卷1,然后再将虚拟卷1映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。使用AS8000-M3进行跨阵列镜像后,对于服务器获得的虚拟卷来说,不会因为任何一个后端磁盘存储系统的故障而出现问题。 ?AS8000-M3节点分离功能实现: 浪潮AS8000-M3拥有节点分离功能,可以把AS8000-M3一个节点组中的两个控制器节点分开放置,两个节点间最远距离可以达到100KM,AS8000-M3节点分离功能只是物理节点的分开放置,但是在用户对于数据的访问以及在 AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同,如果一个

浪潮双活存储解决方案

浪潮数据中心存储双活解决方案 【需求分析】 大数据时代,数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。 传统数据中心存储灾备一般采用主备模式,只有当生产数据中心存储故障后,灾备中心存储才会接管数据访问业务,并且此过程需要手动执行,将灾备中心对应的业务Lun手动激活读写服务;此外,主备数据中心的模式,在正常业务运转情况下,只有主中心发挥作用,备中心的资源一直处于“待命”模式,无法最大程度发挥所有资源的效率。 双活数据中心将是未来数据中心发展的趋势,而存储双活又是数据中心双活的重要基础。 【浪潮存储双活方案设计】 浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建: AS8000-M3虚拟卷镜像功能实现: 浪潮AS8000-M3作为异构存储整合的专业设备,可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响,实现业务连续性。

上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图,对于底层的磁盘阵列来说,其使用方式与现在相同,对其内部的磁盘先进行RAID,然后在RAID 组上进行逻辑磁盘(LUN)的划分。如上图的例子中,首先对两个阵列的磁盘做RAID5,然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘,同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后,形成了虚拟卷为虚拟卷1,然后再将虚拟卷1 映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。使用AS8000-M3进行跨阵列镜像后,对于服务器获得的虚拟卷来说,不会因为任何一个后端磁盘存储系统的故障而出现问题。 AS8000-M3 节点分离功能实现: 浪潮AS8000-M3拥有节点分离功能,可以把AS8000-M3一个节点组中的两个控制器节点分开放置,两个节点间最远距离可以达到100KM,AS8000-M3 节点分离功能只是物理节点的分开放置,但是在用户对于数据的访问以及在AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同,如果一个AS8000-M3节点故障,将由另外一个站点的AS8000-M3 节点接管数据IO,所有应用系统将不受影响。

存储双活架构对比分析

存储双活架构对比分析 世界上没有完美的东西,所有东西都有利弊两个方面。双活项目的建设也是同样。双活是要提升系统的健壮性,进而保证业务的连续性,而双活的弊端是少有人提及的就是要牺牲一部分性能和容量,同时如果较远,还涉及到链路成本。 目前主流的存储双活解决方案,主要有存储网关双活解决方案和存储阵列双活解决方案两类,其中,存储阵列双活解决方案又可以分为双读双写的真正双活解决方案和读写一台仅能够做故障切换的伪双活解决方案。如下图所示: 存储虚拟化网关的双活存储阵列伪双活解决方案存储阵列双读双写解决方案 代表厂家:代表厂家:代表厂家: EMC VPLEX IBM DS8000 HyperSwap HDS VSP GAD IBM SVC HP Peer Persistence EMC VMAX SRDF/Metro

HW Hyper Metro HP XP7 GAD Netapp Metro Cluster 我们可以从如下几个方面来看: 1、发展趋势 EMC和IBM均有采用网关方式实现双活的解决方案,但是,通常是与中低端存储相结合 的廉价解决方案。 对于较大负载的企业级应用,通常采用存储阵列双活解决方案。伪双活解决方案代表产品 是已经基本停止存储研发的IBM的DS8000的HyperSwap、HP中端存储的Peer Persistence、Netapp的Metrocluster和华为的Hyper Metro都是可以实现单台阵列故障另外一台自动接管,但是日常应用读写只能够使用一台,另外一台仅作为备用,这样在做真正的较远距离双活集群时 会遇到很尴尬的问题,如果是Oracle RAC分布在两个机房,总有一端的oracle数据库无法读写本地磁盘,而要经过漫长的中间链路去读写远端磁盘,性能会成为极大的瓶颈。相比较而言,高 端存储的双活技术包括HDS的VSP GAD、EMC VMAX的SRDF/Metro和HP的XP7 GAD, 都是不仅能够实现故障自动切换,而且可以同一业务的双读双写,可以与各类集群软件相互配合 实现负载均衡。 当然,目前的产品形态,还有如下原因。 2、系统可靠性 任何复杂系统都是由多个部件组成的,在常见系统中,系统控制理论将系统分为串行系统和并行系统,结构如下图所示:

统一存储双活方案

统一存储双活方案1、双活存储架构建设目标 系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间(不可忍受)的事故。可能引发系统灾难的因素包括:?系统软、硬件故障,如:软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等; ?机房环境突发性事故,如:电源中断、建筑物倒塌、机房内火灾等; ?人为因素,如:因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等; ?自然灾害:如火灾、地震、洪水等突发而且极具破坏性的事故。 其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下,计算中心机房的硬件设备会部分或完全损坏,造成业务的停顿。请参见下图:

当前用户IT系统缺乏有效的灾难防范手段,难以在灾难发生后,不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后,为降低灾难发生后造成的损失,重新组织系统运行,从而保证业务连续性。 其目标包括: ●保护数据的完整性、一致性,使业务数据损失最少; ●快速恢复业务系统运行,保持业务的连续性。 灾难恢复的目标一般采用RPO和RTO两个指标衡量。 技术指标RPO、RTO: RPO (Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。即在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在半同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据

排队的时间。在实际应用中,同步模式下,RPO一般为0,而在非同步模式下,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性是不相同的,RPO表示业务数据与容灾备份数据的时间差。换句话说,发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。 RTO (Recovery Time Objective):即应用的恢复时间目标。RTO 主要指的是所能容忍的应用停止服务的最长时间,也是是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金。 各种用户的应用对RTO要求不同,业务繁忙的关键业务需要较小的RTO,如果系统恢复时间过长就会影响到业务运行,而许多业务系统的RTO较长,如果一些较小灾难发生在非业务运行时间,那么对业务连续性几乎不会造成任何影响。各种容灾解决方案的RTO有较大差别,基于光通道技术存储区域网(SAN)的同步数据复制,配合远程备用业务系统和跨生产中心与容灾中心的高可用管理系统,这种容灾解决方案具有最小的RTO。相比较而言,普通磁带备份的RTO较长,当灾难发生时需要更长的时间恢复系统。 两存储之间为双活互备工作模式

曙光DS800-G25双活数据中心解决方案介绍

曙光DS800-G25 双活数据中心解决方案介绍 曙光信息产业股份有限公司

1解决方案概述 在信息社会里,数据的重要性已经毋容置疑,作为数据载体的存储阵列,其可靠性更是备受关注。尤其在一些关键应用中,不仅需要单台存储阵列自身保持高可靠性,往往还需要二台存储阵列组成高可靠的系统。一旦其中一台存储阵列发生故障,另一台可以无缝接管业务。这种两台存储都处于运行状态,互为冗余,可相互接管的应用模式一般称之为双活存储。 由于技术上的限制,传统的双活存储方案无法由存储阵列自身直接实现,更多的是通过在服务器上增加卷镜像软件,或者通过增加额外的存储虚拟化引擎实现。通过服务器上的卷镜像软件实现的双活存储,实施复杂,对应用业务影响大,而且软件购买成本较高。通过存储虚拟化引擎实现的双活存储,虽然实施难度有一定降低,但存储虚拟化引擎自身会成为性能、可靠性的瓶颈,而且存在兼容性的限制,初次购买和维护成本也不低。 曙光DS800-G25双活数据中心方案采用创新技术,可以不需要引入任何第三方软硬件,直接通过两台DS800-G25存储阵列实现两台存储的双活工作,互为冗余。当其中一台存储发生故障时,可由另一台存储实时接管业务,实现RPO、RTO为0。这是一种简单、高效的新型双活存储技术。

2产品解决方案 曙光DS800-G25双活数据中心方案由两台存储阵列组成,分别对应存储引擎A、引擎B。存储引擎A和B上的卷可配置为双活镜像对,中间通过万兆以太网链路进行高速数据同步,数据完全一致。由于采用虚拟卷技术,双活镜像对中的两个卷对外形成一个虚拟卷。对服务器而言,双活镜像对就是可以通过多条路径访问的同一个数据卷,服务器可以同时对双活镜像对中两个卷进行读写访问。组成双活镜像系统的两台存储互为冗余,当其中一台存储阵列发生故障时,可由另一台存储阵列直接接管业务。服务器访问双活存储系统可根据实际需要,选用FC、iSCSI方式,服务器访问存储的SAN网络与数据同步的万兆网络相互独立,互不干扰。 组网说明: 1)服务器部署为双机或集群模式,保证服务器层的高可用, 2)存储与服务器之间的连接可以采用FC、iSCSI链路,建议部署交换机进行组网; 3)存储之间的镜像通道采用10GbE链路,每个控制器上配置10GbE IO接口卡,采用光纤交叉直

宏杉科技双活存储解决方案介绍

MacroSAN 双活存储解决方案介绍 杭州宏杉科技有限公司

1. 解决方案概述 在信息社会里,数据的重要性已经毋容置疑,作为数据载体的存储阵列,其可靠性更是备受关注。尤其在一些关键应用中,不仅需要单台存储阵列自身保持高可靠性,往往还需要二台存储阵列组成高可靠的系统。一旦其中一台存储阵列发生故障,另一台可以无缝接管业务。这种两台存储都处于运行状态,互为冗余,可相互接管的应用模式一般称之为双活存储。 由于技术上的限制,传统的双活存储方案无法由存储阵列自身直接实现,更多的是通过在服务器上增加卷镜像软件,或者通过增加额外的存储虚拟化引擎来实现。通过服务器上的卷镜像软件实现的双活存储,实施复杂,对应用业务影响大,而且软件购买成本较高。通过存储虚拟化引擎实现的双活存储,虽然实施难度有一定降低,但存储虚拟化引擎自身会成为性能、可靠性的瓶颈,而且存在兼容性的限制,初次购买和维护成本也不低。 宏杉科技的对称双活存储(Symmetrical Dual Active Storage,简称SDAS)是一项专门针对双活存储方案的创新技术。通过宏杉科技对称双活存储技术,可以不需要引入任何第三方软硬件,直接通过两台同档次的MS系列存储阵列实现两台存储的双活工作,互为冗余。当其中一台存储发生故障时,可由另一台存储实时接管业务,实现RPO、RTO为0。这是一种简单、高效的新型双活存储技术。 宏杉科技的SDAS技术,不仅支持近距离的双活存储系统,而且支持上百公里甚至更远的远距离双活数据中心。近距离的双活存储可以采用更加高效的光纤交叉直连的方式进行组网部署,远距离的双活数据中心采用交换机连接方式,再配以仲裁者机制进行组网部署。宏杉科技的SDAS两套存储之间的链路不仅可以支持10GE以太网,而且在业界率先支持40GE以太网技术。40GE具有目前以太网应用领域中的最高的传输带宽,可以大大降低同步数据传输时延。 目前宏杉科技的MS3000、MS5500、MS7000存储产品都已经支持对称双活存储技术。

浪潮双活存储解决方案

浪潮数据中心存储双活解决方案【需求分析】 大数据时代,数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。 传统数据中心存储灾备一般采用主备模式,只有当生产数据中心存储故障后,灾备中心存储才会接管数据访问业务,并且此过程需要手动执行,将灾备中心对应的业务Lun手动激活读写服务;此外,主备数据中心的模式,在正常业务运转情况下,只有主中心发挥作用,备中心的资源一直处于“待命”模式,无法最大程度发挥所有资源的效率。 双活数据中心将是未来数据中心发展的趋势,而存储双活又是数据中心双活的重要基础。 【浪潮存储双活方案设计】 浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建: AS8000-M3虚拟卷镜像功能实现: 浪潮AS8000-M3作为异构存储整合的专业设备,可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响,实现业务连续性。 上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图,对于底层的磁盘阵列来说,其使用方式与现在相同,对其内部的磁盘先进行RAID,然后在RAID 组上进行逻辑磁盘(LUN)的划分。如上图的例子中,首先对两个阵列的磁盘做RAID5,然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘,同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后,形成了虚拟卷为虚拟卷1,然后再将虚拟卷1映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。 使用AS8000-M3进行跨阵列镜像后,对于服务器获得的虚拟卷来说,不会因为任何一个后端磁盘存储系统的故障而出现问题。 ?AS8000-M3节点分离功能实现: 浪潮AS8000-M3拥有节点分离功能,可以把AS8000-M3一个节点组中的两个控制器节点分开放置,两个节点间最远距离可以达到100KM,AS8000-M3节点分离功能只是物理节点的分开放置,但是在用户对于数据的访问以及在AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同,如果一个AS8000-M3

HDS双活解决方案,1

真正的双活解决方案——HDS全局动态存储虚拟化技术 “双活”近年来一直是业界的热门词汇,特别是在金融业。商业银行多年来致力于容灾备份系统的建设,但确保业务连续性仍是银行信息化需要持续研究的课题。为建立一套真正的双活数据中心,HDS提供的不是一个“封装”解决方案,也不是“外部虚拟化”解决方案,HDS提供的是全局动态存储虚拟化技术(包括双活镜像)——一个真正的双活方案!这不仅实现了IT系统管理的大幅简化与自动化,并具有高可用性特征,可确保关键数据和应用程序的永续运行。 HDS在2014年上半年领先发布了一款革命性产品HDS Virtual Storage Platform G1000(VSP G1000),VSP G1000中的Storage Virtualization Operating System (SVOS)即提供了双活数据中心技术(Global Active Device,GAD)。 零停机,业务永续 GAD功能支持同时在两个地方保存同一数据的读/写副本。其双活设计可以在两个VSP G1000系统之间实现镜像存储卷,这两个VSP G1000系统能够在两端同时接受读/写操作并持续进行更新。如果一个站点的磁盘控制柜发生故障,另一个站点的控制柜将自动接管并继续接受读/写操作。双活数据中心方案可确保最新的存储卷始终可用,并在这两个系统上支持生产工作负载,同时保持完整的数据一致性和数据保护能力。 对于许多关键业务应用而言,任何妨碍数据访问的故障都会导致应用中断,并可能需要进行手动故障切换,以切换到灾备中心。GAD可以在本地及同城提供双活延伸集群,利用双活延伸集群可以实现不停机的工作负载迁移和数据迁移。同时配合使用多路径软件,可以让应用从最短路径访问数据,以获得最高性能。 零RPO / RTO,高枕无忧 银行容灾系统建设的终极目标是实现数据保护和持续不间断的对外服务。传统容灾系统可以做到RPO为零,很难做到RTO为零,因为系统恢复需要时间。而一旦实现双活,RPO和RTO在某些场景下都可以做到“零“,这对于用户来说是一项革命性的进步。数据中心双活技术可以协助银行IT部门实现无缝容灾,业务和服务完全无感知。 零锁定,面向多供应商 HDS GAD面向VMware, Microsoft Hyper-V 以及Oracle 也实现“始终可用”。 HDS 双活技术优势可以概括为以下几方面。 (1)VSP G1000全交换架构,高性能,高可靠性,存储虚拟化整合,分开摆放; (2)Array-SAN-Host 三层架构,结构简单,无四层架构性能瓶颈点和风险点,便于实施,基于存储实现企业级双活; (3)支持结构化和非结构化数据,实现全业务的双活; (4)仲裁机制,避免“脑裂”; (5)就近读,精简配置卷,保障最佳性能; (6)未来扩展N 活,双活+远程异步容灾,实现最佳的系统可用性。 HDS正在利用 GAD技术使存储虚拟化架构实现跨多个企业级存储系统的横向扩展。到目前为止,国内已经有诸多大型银行、医疗机构、教育机构在研究和部署HDS双活解决方案,HDS将全力协助更多客户实现业务与服务的永续运行!FCC 82FINANCIAL?COMPUTER?OF?CHINA

Fujitsu 存储双活解决方案

谈谈Fujitsu 存储双活解决方案 前两天,《高端存储知识》的作者西瓜哥发表了一篇文章《原来富士通ETERNUS DX S3系列已经支持双活,但好像没有看到仲裁机制》,文中对ETERNUS DX S3系列StorageCluster(存储高可用)解决方案进行了相关的介绍和应用场景的分析。在这里要感谢西瓜哥对Fujitsu ETERNUS存储双活解决方案关注和技术普及,同时,我们也将对文中的一些理解偏差(姑且这么说吧)进行进一步的解释和阐述。 问题一:Storage Cluster是否有仲裁机制? 要回答这个问题,我们首先来看看Storage cluster解决方案架构图。 这里仅简单说明一下:生产存储和备用存储之间使用FC链路,通过存储自带的远程复制技术实现LUN数据的实时同步复制,同时生产LUN和备份LUN都Mapping给前端业务主机。当生产存储出现故障时,将自动切换到备用存储上,由于生产存储和备用存储Mapping 给前端主机的端口共享相同的一组逻辑WWPN/WWNN,所以对前端主机来说,后台只有一台存储,且切换是透明的,所以前端绝大多数应用是不会中断的。

上图中的工作站Storage Cluster Controller就是存储双活解决方案中的仲裁者,它时刻监控着生产存储、备用存储的健康状态,当生产存储或者备用存储出现问题,它就开始执行Failover策略。这里需要说明的是Storage Cluster Controller并不是一个单独的软件,它只是一个后台服务进程,该服务进程集成在ETERNUSSF Storage Cruiser Agent软件中,需要单独准备一台工作站或者服务器安装ETERNUSSF Storage 管理套件。 那Storage Cluster Controller什么时候干活呢?它如何干活呢?它干些什么事呢?那就进入第二个话题----Storage cluster 故障处理机制。 问题二:Storage Cluster 故障处理机制 在一个SAN环境中基本包含三类组件:主机、交换机、存储。StorageCluster不关心前端的主机和交换机故障,只关注存储故障。也就是说主机链路或者交换机故障,多路径软件负责链路的切换,跟后台存储没有一分钱关系。 现分别介绍存储出现故障时,Storage Cluster Controller怎么来仲裁的? 场景一:生产存储RAID故障

NetApp统一存储双活实施方案

NetApp统一存储双活方案

————————————————————————————————作者:————————————————————————————————日期:

NetAp统一存储双活 方案 NetApp统一存储双活方案 1、双活存储架构建设目标 系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间(不可忍受)的事故。可能引发系统灾难的因素包括:?系统软、硬件故障,如:软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等; ?机房环境突发性事故,如:电源中断、建筑物倒塌、机房内火灾等; ?人为因素,如:因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等; ?自然灾害:如火灾、地震、洪水等突发而且极具破坏性的事故。 其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下,计算中心机房的硬件设备会部分或完全损坏,造成业务的停顿。请参见下图:

当前用户IT系统缺乏有效的灾难防范手段,难以在灾难发生后,不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后,为降低灾难发生后造成的损失,重新组织系统运行,从而保证业务连续性。其目标包括: ●保护数据的完整性、一致性,使业务数据损失最少; ●快速恢复业务系统运行,保持业务的连续性。 灾难恢复的目标一般采用RPO和RTO两个指标衡量。 技术指标RPO、RTO: RPO (Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。即在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在半同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,同步模式下,RPO一般为0,而在非同

华为存储双活解决方案

华为双活解决方案彩页Huawei Active-Active Solution Brochure

前言Overview 随着企业信息系统的快速发展和业务大集中速度的加快,企业信息中心技术风险也相对集中。一旦生产中心需要升级维护,或发生停电、火灾等灾难时,将导致企业业务处理停顿,甚至客户数据丢失,给企业带来巨大的经济和名誉损失。 作为全球领先的信息与通信解决方案供应商,华为基于对企业容灾需求的深刻理解,通过对容灾领域多年的技术研究,开发出华为存储双活解决方案,对用户数据的和业务连续性的有效保护,完成存储资源的整合和按需分配,还通过可视化的管理极大提高容灾业务运维的便利性。 华为存储双活解决方案将帮助企业应对突发事件和灾难,为企业的业务连续性和数据安全保驾护航。 挑战Challenges 随着信息化技术的发展,企业的容灾建设正面临着诸多挑战: 需要保证数据的安全性和可恢复性,满足7x24小时高可靠运行的业务连续性要求。 各类应用系统环境复杂,文件、数据库、虚拟化平台等均有业务连续性需求。 容灾演练操作步骤复杂,需要太多人工干预,容易发生遗漏和误操作;同时容灾 业务管理复杂,运维成本高,效率低。

SAN/NAS/Dorado 其他华为站点A SAN/NAS/Dorado 其他华为站点B 华为公司基于对容灾建设需求的深入了解,结合华为在容灾领域的多年技术积累和优秀实践,推出了华为存储双活解决方案。它在实现了对数据和业务的多层次容灾保护的同时,解决了不同厂商设备之间容灾的兼容性问题,并通过可视化的容灾管理系统,有效提高了容灾业务的管理效率。 为了更贴近客户的真实场景,华为还与应用厂商进行联合调优,共同输出华为存储、网络、光传输设备与应用结合的经过验证的端到端的最佳实践,覆盖Oracle、VMware、SAP等主流数据库、虚拟化和应用平台。 华为双活解决方案Huawei Active-Active Solution HyperMetro 华为存储双活解决方案 Oracle RAC集群 VMware集群 文件系统集群 SAP应用集群 …… SAN/NAS/Dorado 其他华为IP&FC 站点A SAN/NAS/Dorado 其他 华为IP&FC 站点B

EMC双活数据中心解决方案 V4.0资料

EMC数据中心容灾系统 建设方案建议书 EMC电脑系统(中国)有限公司 Version 1.0,2014/10

前言 信息是用户的命脉, 近十年来信息存储基础设施的建设在用户取得长足的进步。从内置存储转向外置RAID存储,从多台服务器共享一台外置RAID阵列,再到更多台服务器通过SAN共享更大型存储服务器。存储服务器容量不断扩大的同时,其功能也不断增强,从提供硬件级RAID保护到独立于服务器的跨磁盘阵列的数据镜像,存储服务器逐渐从服务器外设的角色脱离出来,成为单独的“存储层”,为数据中心的服务器提供统一的数据存储,保护和共享服务。 随着用户业务的不断发展,对IT系统尤其是存储系统的要求越来越高,鉴于用户业务由于信息的重要性,要求各地各用户多中心来预防单一数据中心操作性风险。 多数据中心建设方案可以预防单数据中心的风险,但面对多数据中心建设的巨额投资,如何同时利用多数据中心就成为IT决策者的首要问题。同时利用多数据中心就必需实现生产数据跨中心的传输和共享,总所周知,服务器性能的瓶颈主要在IO部分,数据在不同中心之间的传输和共享会造成IO延时,进而影响数据中心的总体性能。 同时,各家厂商不断推出新技术,新产品,容量不断扩展,性能不断提高,功能越来越丰富,但由于不同存储厂商的技术实现不尽相同,用户需要采用不同的管理界面来使用不同厂商的存储资源。这样,也给用户业用户带来不小的问题,首先是无法采用统一的界面来让服务器使用不同厂商的存储服务器,数据在不同厂商存储服务器之间的迁移也会造成业务中断。 作为信息存储行业的领先公司,EMC公司针对用户跨数据中心信息传输和共享的迫切需求,推出存储VPlex解决方案,很好的解决了这些问题。本文随后将介绍VPlex产品及其主要应用场景,供用户信息存储管理人士参考。

互联网+双活数据中心解决方案

构建永不宕机的信息系统 ——双活数据中心

双活数据中心解决方案目录 案例分享 12

存储层 应用层 双活数据中心端到端技术架构 数据中心A 数据中心B 双活存储层双活访问、数据零丢失 异构阵列 双活应用层 Oracle RAC 、VMware 、FusionSphere 跨DC 高可用、 负载均衡、迁移调度 双活网络层高可靠、优化的二层互联 最优的访问路径 ≤100km 裸光纤 Fusion Sphere Fusion Sphere 接入层 汇聚层核心层DC 出口网络层 GSLB SLB GSLB SLB

前端应用的双活(VMware ) vm vm vm vm vm vm vm vm vm vm vm vm AD vm vm vm vm SQL node1MSCS vCenter Server vm vm vm vm APP……. APP……. SQL node2MSCS vm vm vm vm vm vm vm vm vm 大二层互通网络,跨数据中心VM 配置双活应用,使用虚拟化网关提供的镜像卷作为共享存储 Weblogic 业务集群 管理集群 vm Weblogic ?vSphere Cluster HA ?vSphere Cluster DRS ?配置PDL 参数 ?Huawei OceanStor UltraPath for vSphere ? 配合负载均衡设备实现 Weblogic 访问自动漂移和均衡 VMware 配置要点 业务访问效果 ?业务访问负载均衡 ?虚拟机分布按业务压力自动均衡 ?故障自动切换访问?Weblogic 可动态扩展 ? 单数据中心故障恢复后,虚拟机自动回切

双活数据中心解决方案-设计方案

双活数据中心解决方案

目录 1 用户面临的挑战和需求 (3) 1.1面临的挑战 (3) 1.2迫切需求 (3) 2NetApp双活数据中心解决方案 (4) 3NetApp解决方案优势 (5)

1用户面临的挑战和需求 1.1 面临的挑战 ?目前几乎所有金融行业用户的业务正常开展都离不开后端IT环境的支持,一旦IT 环境由于各种原因不能正常提供支撑服务,就会对用户的业务造成巨大影响。因此金融用户对后端IT系统的可靠性和可用性的要求越来越高,需要保证IT系统7×24的运行能力。 ?虽然目前大部分的专业存储系统均实现了硬件容灾保护,单个部件的失效不会导致其数据访问能力的失效。但是一旦某套存储系统由于一些严重故障或灾难性事故导致其整体性失效,则会导致前端应用系统的宕机从而影响业务系统的正常运行。因此金融用户需要在硬件冗余的基础上提供更高的可靠性保证。 ?目前很多金融用户已经采取了多数据中心的架构,并且在多个数据中心之间进行了数据容灾保护架构的建设。但是由于传统的容灾架构基本上采用了Active-Standby 的方式,因此一方面限制了数据中心的角色和功能,另一方面也限制了用户在各个数据中心部署应用系统的灵活性。最重要的一点,传统的容灾架构在进行容灾恢复的时候过程复杂且冗长,缺乏足够的智能化。因此金融用户需要一种更加灵活更加智能化的多数据中心架构。 1.2 迫切需求 ?后端存储系统在硬件冗余保护的基础上,需要提供更高级别的可靠性保证,能在存储系统发生整体性故障的时候还能保证数据访问的正常进行,从而防止这些严重故障或灾难性事故对业务系统造成严重影响。 ?实现双活的数据中心架构替代原有的Active-Standby架构,双活数据中心架构必须提供如下的功能: o前端应用服务器可以从两个数据中心均能对同一份数据进行正常访问,同一个应用的服务器可以根据实际需要部署在两个中心当中的任何一个或同 时部署在两个中心,部署在两个中心的应用服务器均可以处于服务提供状 态

HDS GAD 存储双活竞争对比分析

世界上没有完美的东西,所有东西都有利弊两个方面。双活项目的建设也是同样。双活是要提升系统的健壮性,进而保证业务的连续性,而双活的弊端是少有人提及的就是要牺牲一部分性能和容量,同时如果较远,还涉及到链路成本。 目前主流的存储双活解决方案,主要有存储网关双活解决方案和存储阵列双活解决方案两类,其中,存储阵列双活解决方案又可以分为双读双写的真正双活解决方案和读写一台仅能够做故障切换的伪双活解决方案。如下图所示: 存储虚拟化网关的双活存储阵列伪双活解决方案存储阵列双读双写解决方案 代表厂家:代表厂家:代表厂家: EMC VPLEX IBM DS8000 HyperSwapHDS VSP GAD IBM SVC HP Peer PersistenceEMC VMAX SRDF/Metro HW Hyper Metro HP XP7 GAD Netapp Metro Cluster 我们可以从如下几个方面来看: 1、发展趋势 EMC和IBM均有采用网关方式实现双活的解决方案,但是,通常是与中低端存储相结合的廉价解决方案。 对于较大负载的企业级应用,通常采用存储阵列双活解决方案。伪双活解决方案代表产品是已经基本停止存储研发的IBM的DS8000的HyperSwap、HP中端存储的Peer Persistence、Netapp的Metrocluster和华为的Hyper Metro都是可以实现单台阵列故障另外一台自动接管,但是日常应用读写只能够使用一台,另外一台仅作为备用,这样在做真正的较远距离双活集群时会遇到很尴尬

的问题,如果是Oracle RAC分布在两个机房,总有一端的oracle数据库无法读写本地磁盘,而要经过漫长的中间链路去读写远端磁盘,性能会成为极大的瓶颈。相比较而言,高端存储的双活技术包括HDS的VSP GAD、EMC VMAX的SRDF/Metro和HP的XP7 GAD,都是不仅能够实现故障自动切换,而且可以同一业务的双读双写,可以与各类集群软件相互配合实现负载均衡。 当然,目前的产品形态,还有如下原因。 2、系统可靠性 任何复杂系统都是由多个部件组成的,在常见系统中,系统控制理论将系统分为串行系统和并行系统,结构如下图所示: 左图为串行系统,右图为并行系统,串行系统中只有当A、B均为正常工作状态时,整个系统才能够正常工作,并行系统中,只要A、B有一个正常工作整个系统就是正常工作的。网关类的是串行系统,网关的最大可靠性仅有99.999%,中端存储的可靠性也是99.999%,两者串联后单边的可靠性肯定低于99.999%,这意味着一年的意外停机时间高于5分钟。基于存储阵列的双活,不会因为串入网关导致系统可靠性降低,同时因为高端存储的可靠性通常高于 99.9999%,因此,在高端存储存储领域是不能够容忍加入网关降低系统可靠性的。 同时,因IT技术的复杂性,每多一层中间环节,就会增加故障点,降低系统可靠性。两者的对比如下图所示,网关类的故障点是存储阵列双活的2倍多。

相关主题