搜档网
当前位置:搜档网 › 应用容灾方案

应用容灾方案

应用容灾方案
应用容灾方案

目录

目录 (1)

一、行业需求分析 (2)

1.1 行业背景分析 (2)

1.2 数据备份保护需求 (2)

1.3 业务连续性需求 (3)

1.4 方案目标 (4)

1.5 方案设计原则 (5)

二、方案设计 (6)

2.3 方案三:XXX备份容灾整体解决方案 (6)

2.4 系统部署建议 (7)

2.4.1 应用及数据容灾策略 (7)

2.4.2应用容灾过程 (8)

2.4.3 数据恢复过程 (8)

2.5灾难恢复的设计 (8)

2.5.1 灾难恢复制度 (9)

2.5.2 灾难演习制度 (9)

2.5.3 灾难恢复方式 (9)

2.6 灾备系统管理建议 (10)

2.6.1 灾备系统管理员的职责 (10)

2.6.2 修改备份容灾策略的过程 (10)

2.6.3 恢复管理 (10)

三、方案特色 (12)

3.1 备份容灾一体化 (12)

3.1.1 应用系统容灾 (12)

3.1.2数据集中,高效备份 (12)

3.1.3领先的备份、容灾、存储一体化 (12)

3.2 功能强大,简单易用 (12)

3.2.1 All-in-One-Web (12)

3.2.2支持多类型客户端 (13)

3.2.3重复数据删除,充分利用空间 (13)

3.2.4绿色节能,更低的投入 (13)

3.3 安全备份,备份即安全 (13)

3.3.1 基于强认证的安全备份 (13)

3.3.2 灾备系统审计功能 (14)

一、行业需求分析

1.1 行业背景分析

目前,信息化建设已经成为全球社会和经济发展的重要工具,各行各业都在大力建设符合本行业需求的生产和管理信息化系统,并已经从中大为受益,生产效率和服务质量均有很大程度的提高。作为社会公共事业的城市XX行业,更是顺应社会发展和技术革新的趋势,早已摆脱了纸质文件的管理模式。

我国城市XX企业从上世纪90年代初期就不同程度地开始致力于信息系统的建设,在长期的探索、开发和应用过程中,积累了丰富的建设经验,企业信息化的水平不断提高。近几年来,“数字XX”、建设信息社会等新趋势的出现,对城市XX企业信息化的要求越来越高。以生产管理、管网管理、营业管理、无纸化办公为主要核心的管理信息系统,得到长期的应用实践,已经成为城市XX企业工作中不可缺少的工具。

城市XX企业的业务性质与一般的企事业单位有很大的不同,它面对着千家万户的服务需求,管理着整个城市范围内纵横交错的地下管网和大量设备。因此,与之相匹配的信息系统必须符合安全稳定XX的严格要求,必须要为做好用户服务的工作宗旨提供现代化的信息管理手段。自来水作为城市的生命之源,XX企业的服务质量关系到人民的健康和政府的形象。

此外,城市XX企业信息系统的建设也是响应国家确立的以信息化带动工业化,以信息化推动现代化的发展战略思想。城市XX信息化不仅适应城市信息化迅速发展的需要,而且对XX企业的企业现代化建设和管理工作来说至关重要,充分体现了城市XX企业“数字XX”的服务理念和管理水平,也是响应国家《城市XX行业2010年技术进步发展规划及2020年远景目标》的具体实践。

1.2 数据备份保护需求

既然信息化已经在城市XX行业广泛普及,那么在信息化系统中数据的重要性不言而喻。关键数据的丢失,不仅造成经济损失,甚至关系到企业的生死存亡。美国国家档案与记录管理局的研究显示,在没有很好的数据保护和恢复策略的公司中,80%的公司将会在发生关键数据丢失后的两年内倒闭。另外的调查显示,下列因素是导致数据丢失的常见原因

数据的破坏难以预测,也存在多种可能性,因为要建立起完善的数据备份系统和备份机制。城市XX行业的信息化系统中,类似于XX管网数据、用户信息、营业收费数据等等,都是不允许丢失的关键数据,必须将其重点保护起来。

1.3 业务连续性需求

伴随着IT信息化的推进,自来水企业运营对IT系统的依赖度越来越高,IT系统的可持续化运行及IT系统中数据的安全性,对企业发展有重大影响。当灾难突发时,绝大多数企业所能做的事情,就是在灾难发生两三天以后恢复灾难发生前的数据。而这并不能满足在激烈竞争环境中力求发展的企业需求。越来越多的企业认识到,仅仅做好数据备份这个环节,对于保障企业在遭遇突如其来的意外事件前,依然能够保持业务持续运行,还远远不够。大多数企业所希望的,不是灾难发生若干天后忙碌、紧张而又缓慢地恢复整个业务系统,而是希望不论任何灾难降临,业务都能持续不断的运行,即实现业务连续性。

要实现业务的连续性,就要实现应用系统的容灾。在选择容灾方案时,RPO、RTO及ROI(投资回报率)是任何企业都需要谨慎面对的命题,而利用系统宕机所带来的成本代价可以衡量业务连续性投入所能带来的回报。如果你的业务系统宕机一小时,将会怎么样?Meta集团在对多达十几个行业的调查,得出的结论是平均损失高达100万美元,下图是21

个行业宕机1小时需要付出的代价:

企业的业务越来越依赖于IT系统、软件以及数据,而系统宕机给企业带来的损失却不断上升。例如制造业企业的ERP系统如果宕机,它的整个业务将会停顿;在IT环境中要达到99%的正常运行,意味着每年3.5天的宕机时间,而99.99%的正常运行意味着每年8小时的宕机!

城市XX行业作为社会公共事业,IT系统的瘫痪就可能导致整个城市XX的中断,不仅仅意味着经济损失,更无法达到为用户服务的宗旨,甚至会引发严重的社会问题。

面对如此严峻的形式,如果自来水企业希望用最少的投资获得系统100%运行,就必须考虑采用一种最合适的方案,在保证业务系统持续运行的同时获得最佳投资回报,从而更专注于业务而不必担心系统宕机会带来的影响。容灾,势在必行!

1.4 方案目标

随着城市XX企业IT业务数据量的快速增长,为了保证业务的连续性,提高业务系统的容灾能力,并提高灾难应急水平,需要建设完整的灾备系统,使业务系统得到有效的保护,增强信息基础设施和重要信息系统灾难恢复能力。根据城市XX行业的实际需求,建设的灾备系统需具备如下功能:

1.结构化和非结构化数据的备份及恢复。

2.支持关键数据库的持续保护和灾难接管,保证关键数据不丢失以及数据库服务不中

断。

3.对关键业务系统进行持续保护,并在灾难发生后,可通过虚拟机或物理机的方式进

行数据恢复和业务接管。

4.鉴于信息系统的复杂性,方案同时支持多种操作平台(Windows、Linux、UNIX)

的备份与恢复;

5.在保证业务系统高可用的同时,支持容灾数据恢复到任意时间点;

6.支持统一监控功能,能够监控到灾备系统各模块的工作状态以及资源消耗等数据;

7.支持基于Web界面的管理、监控、维护操作,方便管理员学习和操作。

8.根据IT 环境发展的需要,容灾存储可在线扩容。

9.灾备系统应可实现容灾恢复演习,以验证备份数据的可用性及应用接管的可行性。

1.5 方案设计原则

根据城市XX行业的需求和业务特点,在灾备系统建设方案设计时,我们将遵循以下原则,保证整个方案的针对性和合理性。

符合行业技术潮流和发展方向

软件产品符合国际主流的技术和发展方向,具有很长的技术寿命。

支持未来应用系统的可扩展性

通过模块化的扩展支持未来可能投入使用的应用系统,减少额外投资。

减少对正常的业务系统的影响

灾备系统的实施尽量避免影响到业务系统正常运行。

系统的安全性

从应用服务器操作系统、生产数据、容灾数据到容灾接管、灾难恢复、容灾演习,灾备系统都应该提供高可靠的安全保障体系,保证数据的安全。

恢复数据的可靠性

灾备系统不但要能够实现应用系统的高可用,同时要能兼顾历史数据恢复的可靠性,真正实现业务系统的容灾。

二、方案设计

2.3 方案三:XXX备份容灾整体解决方案

由于XX企业信息化系统的复杂性,我们将各子系统中的服务器分为非关键应用服务器和关键应用服务器,分层次对其进行保护。对于非关键应用服务器,我们需要关注的是系统的备份,以保证故障排除后服务器系统和应用能恢复正常;而对于关键应用服务器(例如:数据分析服务器、数据交换服务器、GIS系统服务器、计费系统服务器、财务管理服务器、OA服务器、Web服务器),我们需要关注的是业务的连续性,也就是应用不中断,因此我们需要对应用进行容灾。

我们提供了两种容灾方式:一种是虚拟机容灾,通过虚拟化平台上创建虚拟化容灾服务器,然后将生产服务器的系统、应用环境以P2V的方式复制到虚拟化容灾服务器中再通过内置的实时复制及灾难恢复功能,为生产服务器提供应用容灾保护。在满足业务可持续性运行需求的基础上,采用虚拟服务器作为容灾服务器,可有效的减少方案的投入成本并降低管理难度;应用系统可达到RPO和PTO都接近于零的目标;一种是物理机容灾:XXX 备份存储柜将生产服务器的系统、应用环境恢复到物理容灾服务器,并继续向外提供服务。这种方式最大的优点在于能够提供故障后的性能保证,适合于性能要求较高的应用。

系统拓扑图如下:

关于虚拟机容灾和物理机容灾的选择,我们可以根据DRO指标(DRO即容灾目标,为容灾服务器与生产服务器的性能比值)。

DRO>=90%:采用实体机,且配置基本与生产服务器匹配

DRO>=70%:采用配置相当于生产机70%性能以上的实体机,或者虚拟机

DRO>=50%:采用配置相当于生产机50%性能以上的实体机,或者虚拟机

DRO>=30%:采用配置相当于生产机30%性能以上的实体机,或者虚拟机

2.4 系统部署建议

2.4.1 应用及数据容灾策略

XXX的备份容灾方案是一种可持续性的容灾方案,可保证业务系统在发生灾难时仍可持续对外提供服务。因此,为了能够实现对数据库及文件系统的持续保护(CDP),需要在进行数据备份和灾难恢复之前设置好容灾策略:

1)配置容灾服务器,安装与生产服务器相同版本的应用软件和数据库软件,保证

容灾服务器的应用能正常使用,如果通过虚拟服务器做容灾则需要通过P2V工

具将生产服务器迁移到虚拟化平台,迁移出的虚拟服务器跟原来的生产服务器

的应用配置和数据库完全相同,不需要额外配置;

2)为实时备份任务分配合适的存储空间:在创建实时任务之前,需要划分专门的

OFS卷来存储实时复制的数据;同时,为了保证网络传输过程中数据的一致性,

实时备份任务会将变化的数据先缓存一份在生产服务器本地硬盘日志缓冲池,

因此也需要进行如下配置:

?分配一个或多个OFS卷作为实时备份数据的存放地点,大小可以视数据量

大小而定,一般建议不低于原始数据的2倍;

?如果业务系统上的数据变化比较频繁,且变化数据量较大,在选择本地日

志缓冲池的时候请能选择剩余空间较大的本地磁盘。

3)根据生产服务器保护策略的不同建立实时备份任务和灾难恢复任务。实时备份

任务用于对数据进行持续保护,而灾难恢复任务创建后,当生产服务器出现宕

机,容灾服务器可进行接管,接替生产服务器对外继续提供服务,从而保证业

务的连续性。具体建议如下:

?如果不需要进行业务接管,则只需创建实时备份任务,并随时观察任务的

执行状况及输出信息;

?如果需要进行业务接管,需要创建实时备份任务后,相应地创建一个或多

个灾难恢复任务,灾难恢复任务的多少视容灾服务器设备数量而定;

?创建灾难恢复任务时可对生产服务器进行故障检测配置,若生产服务器出

现异常,且持续一段时间后,系统就会判断生产服务器发生故障,并进行

接管。判断故障的条件可根据实际情况配置,例如:配置生产服务器5分

钟之内无法访问即认为是断开连接,或者数据库停止对外服务后,尝试重

启10次即认为数据库发生故障。

接管策略的配置:XXX备份软件提供手动接管和自动接管两种策略,当故障检测条件满足后,容灾服务器即可进行自动业务接管,如果不依赖于故

障检测条件,当生产服务器出现故障时可根据需要通过管理控制台进行手

动接管。

2.4.2应用容灾过程

XXX的应用容灾方案是为了保证业务可持续运行,借助XXX备份软件内置的实时备份和灾难恢复模块,可保证业务系统在发生灾难后可持续对外提供服务。首先必须为生产服务器数据库或文件系统创建实时备份任务和灾难恢复任务,当生产服务器正常运行时,数据库服务器和应用服务器的数据会持续复制到对应的容灾服务器上,保持容灾服务器和生产服务器数据的一致性。若生产服务器发生故障,如网络故障、服务器掉电、应用故障、数据损坏等,系统会根据设置的故障检测策略结果进行判断,如果满足接管条件且设置自动接管,则容灾服务器会自动接管,接替生产服务器继续对外提供服务;如果没有设置为自动接管,则当接管条件满足后,系统会发出警告或记录日志,提醒管理员接管业务,管理员可在管理控制台的操作页面上进行手动接管。接管成功后,可以进入备份数据管理页面,选择数据库或文件系统最新的时间点或指定的时间点,恢复到生产服务器;或者进入灾难恢复管理页面,将生产服务器添加到对应的灾难恢复任务中,添加成功后,系统会自动恢复最新的数据到生产服务器。数据恢复完成后,若已将生产服务器添加到对应的灾难恢复任务中,则通过管理控制台,单击手动接管,即可将业务从容灾服务器切换回生产服务器。应用容灾过程从创建任务到应用接管到应用回切,实现了业务的连续性及最小RPO、RTO的指标。

2.4.3 数据恢复过程

当数据损坏或丢失时,可以从XXX备份存储柜中恢复数据。借助XXX备份存储柜,数据的恢复变得快速和简单。对于容灾数据而言,通过Web统一管理界面,可以选择精确到秒级的时间点恢复,将数据库服务器和应用服务器的容灾数据恢复到生产服务器。

对于系统备份的数据而言,可以选择任意的时间点进行操作,无论是完全备份、增量备份还是差异备份,都能一步到位进行恢复(无需先恢复完全备份时间点,再恢复增量或差异备份时间点)。

2.5灾难恢复的设计

灾难恢复在整个应用容灾过程占有相当重要的地位,因为它关系到系统在经历灾难后能否迅速恢复到可用状态。传统的备份方法,如果系统彻底崩溃,要恢复数据必然要先进行操作系统和应用程序重装、配置等繁琐的操作,不仅浪费大量的时间,还会造成业务的长时间停顿并丢失数据。因此系统崩溃后,能迅速恢复系统到可用状态是重中之重。

2.5.1 灾难恢复制度

为了将灾难的损失减到最低,需要严格执行已制定的数据库和文件系统的容灾策略和系统备份策略,并定期对灾备数据进行检查,保证灾难发生后数据能够有效恢复。

为了保证灾备任务正常运行,管理员需要定期进行巡检,查看绑定的告警邮箱信息,查看定时备份任务、实时备份任务及灾难恢复任务的执行情况,同时关注存储空间的使用状况。

制定应急预案,在灾难发生的第一时间就有相关人员立刻响应,如果数据库服务器和应用服务器发生灾难触发了接管操作,管理员应立即尝试恢复原生产服务器,并将恢复后的生产服务器添加到灾难恢复任务中,在第一时间使业务系统恢复正常。

2.5.2 灾难演习制度

要保证灾难恢复的可靠性,仅仅依靠检查灾备任务能否正常运行,或者仅确定灾备数据是有效的还不够,还要结合灾难演练,用以验证灾难发生时容灾服务器的可用性,确保能够成功接管。

对于系统定时备份而言,每隔一段时间,可以利用淘汰的机器或多余的硬盘进行灾难恢复模拟演练,以熟练灾难恢复的操作过程,并检验所备份的数据是否可靠。对于数据库服务器和应用服务器的容灾实时复制任务而言,可利用XXX备份软件内置的灾难演习模块进行验证,通过管理控制台统一管理界面,单击开始演习按钮,即可进行演习操作。演习过程中容灾服务器会尝试对外提供服务,使验证过程更加直观和有效。

2.5.3 灾难恢复方式

当业务系统遭受破坏时,可根据实际的系统环境,采用如下灾难恢复方式:

对于采用了应用容灾保护的关键应用服务器,有下面几种情况:

?如果出现数据异常(逻辑错误或数据丢失),且没有进行容灾接管,可以先停止生

产服务对外服务,并立即选择最近的时间点进行恢复,数据恢复完成后立即重启应

用和实时备份任务以及对应的灾难恢复任务;

?如果发生应用故障(系统崩溃等),利用容灾服务器进行自动或手动接管,接替生

产服务器对外提供服务。随后,需要先恢复生产服务器的应用(如果系统或者硬件

损坏要尝试用先恢复系统或者更换硬件),再通过现有IP网络连接到XXX备份存

储柜,将恢复后的生产服务器添加到灾难恢复任务中,使容灾数据反向复制到生产

服务器,保持数据的一致,完成后再将业务切换回原生产服务器。

2.6 灾备系统管理建议

2.6.1 灾备系统管理员的职责

鉴于数据保护的重要性,灾备系统也需要有相应的人员来负责管理。灾备系统虽然不如其它系统复杂,但也需要通过简单的学习才能更好对灾备系统进行有效、安全的管理。灾备系统管理员可以是专职的也可以由系统管理员、数据库管理员或网络管理员兼职。

尽管灾备系统管理员可以对整个灾备系统拥有至高无上的管理权限,但在实际操作中灾备系统管理员的主要职责应该是协助其它管理者使用灾备系统,充分发挥灾备系统的作用,保证业务系统的安全可靠。

无论是在制定新的或改变已有的备份策略时,灾备系统管理员应与系统管理员和数据库管理员进行沟通,由他们决定备份策略的内容,也就是说备份策略的制定者应该是系统管理员和数据库管理员而不是灾备系统管理员。灾备系统管理员只负责协助其它管理员使用灾备系统。由系统管理员和数据库管理员决定对哪些数据进行备份、在什么时候进行备份、备份是使用全备份或增量备份以及备份的保存周期等,最终再由灾备系统管理员根据制定的策略,创建灾备任务并监控各任务的状态,确保灾备系统的可用性及可靠性。

2.6.2 修改备份容灾策略的过程

服务器系统的改变或数据库的改变以及应用的需求等在实际操作过程中都难以避免,为了适应各种需求,需要对灾备系统的备份策略进行修正以适应这些改变。当需要对备份策略进行改变时,应按一定的程序执行:

1.首先,应由应用、系统或数据库管理员提出需求,将需要改变的内容以书面形式提

交给灾备系统管理员;

2.管理员收到需求后,需要确定修改内容的合理性以及可行性,分析修改操作是否会

对其他应用系统产生影响并尽量将影响控制在最小范围。在确认可以进行修改后,灾备系统管理员再执行变更操作;

3.管理员将灾备系统修改的内容记录下来进行备案;

4.安排相关人员对修改后的部分进行相应的测试。

2.6.3 恢复管理

恢复操作会直接影响到实际的应用执行,如果恢复操作不当可能会造成严重的后果。因此,恢复操作应严格按照一定的操作程序进行。

故障确认

在进行恢复之前首先应该确认造成故障的原因。故障的原因非常多,应该分清是操作系统故障还是数据库故障。如果是数据库的故障,不同的数据库应采用不同的故障分析方法,有时可以使用数据库提供的故障诊断工具进行故障分析。这些工作应由相应的管理者如系统管理员或数据库管理员负责进行,在完成故障分析后确认需要进行恢复操作后,再由相应的

管理员提交书面故障分析报告。

制定恢复计划

灾备系统管理员在收到故障分析报告后应与相应管理员一起制定详细的恢复计划,包括恢复的内容、恢复的时间、恢复的操作步骤、恢复对应用造成的影响等,最后形成一个书面的恢复计划。灾备系统管理员应将故障分析报告与恢复计划一起提交到相应的主管领导审批。主管领导应确认恢复对生产造成的影响,在批准执行恢复前应与有关部门进行沟通确认后,通知有关部门进行恢复前的准备工作。

恢复操作

进行恢复操作前,灾备系统管理员与相应管理员应再次确认恢复计划的可行性及可能会造成的后果,并对现有的备份数据作相应的备份,以防止在恢复的过程中因为难以预料的意外引发致命的错误,确认后便可着手进行恢复操作。在进行恢复操作时应将整个执行过程做详细的记录并备案。

恢复后的操作

完成恢复后应测试恢复的结果,测试成功后,再对恢复后的业务进行相应的备份。完成后,将执行恢复操作的管理员、恢复操作的时间、过程、完成的状况等形成书面报告,报给有关领导进行审批。审批后的恢复报告应与故障分析报告、恢复计划、恢复操作报告一起进行存档。

三、方案特色

XXX备份容灾方案使数据、应用、系统得到统一保护,保证数据丢失时高可靠的恢复性,还为关键应用服务器提供业务持续性容灾,保证关键应用服务器出现故障后容灾服务器或虚拟平台可进行接管,确保业务的持续性。

3.1 备份容灾一体化

3.1.1 应用系统容灾

支持对XX企业IT系统中所有关键服务器以及网站服务器进行应用容灾

基于实时备份技术,对各类型数据库及文件系统进行持续保护

支持数据恢复到任意时间点,时间点可以精确的秒级

智能的故障检测机制和服务器灾难接管策略,可有效的保证关键业务持续性、接管后数据恢复的一致性

支持故障演习,管理员可随时验证容灾数据的有效性和容灾服务器的可靠性

支持对文件系统的持续保护

3.1.2数据集中,高效备份

所有服务器和PC的操作系统以及数据均集中备份到统一的XXX备份存储柜上,一旦服务器或PC环境崩溃,可通过灾难恢复、数据恢复等措施迅速还原到工作状态,相对于手工恢复而言,其效率提高95%,可将损失平均减少72%。

3.1.3领先的备份、容灾、存储一体化

作为最佳的备份、容灾、存储一体化解决方案,具有面向异构环境、异构平台、异构应用的统一备份保护,实现对服务器的全面数据保护;支持基于CDP应用容灾,为核心服务器提供接近于0的RPO和RTO保护应用;无需改变原有网络架构,无需新购硬件,既减少投资浪费又提供完整可扩展的解决方案。

3.2 功能强大,简单易用

3.2.1 All-in-One-Web

采用All-in-One-Web,在一个Web界面里,管理存储资源、虚拟化容灾服务器、备份计划、实时复制策略和灾难恢复接管计划

单一用户登录可实现数据保护和应用容灾的统一配置

集成化管理可进一步将容灾策略、备份策略相结合,获得最佳数据保护和应用容灾效果

全局介质管理,包括介质及介质上数据的删除、介质信息、空间大小的修改等

提供服务器自我修复功能,当出现意外中止、产生死锁,可自动修复到工作状态,减少管理员对灾备系统的干预

提供灾备系统的各项状态的报表数据,并对日志、执行历史、介质空间等信息进行分析,为用户优化备份策略提供参考

简化管理员的操作,支持数据集中备份

3.2.2支持多类型客户端

XXX备份软件为您提供普通型、后台型和安全型客户端,分别适用于集中备份、强制备份和安全备份策略

普通型客户端:在管理授权后可管理有权限的备份、恢复任务,管理员也可对其进行主动备份管理

后台型客户端:客户端在不知情的情况下,管理员主动备份客户端数据,强制备份,无需告知客户端

安全型客户端:管理员在无授权情况下,无法对该类型客户端进行备份和恢复,无权查看安全性客户端数据内容

集中备份时,可以通过集中策略、计划、多客户端进行统一的网络环境保护

3.2.3重复数据删除,充分利用空间

对冗余数据进行清理,精简数据传输量,减少数据传输时间,极大提高了数据传输效率,降低了备份任务对带宽的要求;同时,节省了大量磁盘空间,充分保护了用户的投资。

3.2.4绿色节能,更低的投入

XXX备份存储柜作为一体化的备份设备,初始化成本大大降低,性能加速并且只需一个厂家提供全程产品维护,耗费维护时间和维护成本也将更低,绿色节能技术进一步降低电力消耗成本和冷却成本。

3.3 安全备份,备份即安全

3.3.1 基于强认证的安全备份

强身份认证备份

与USB令牌、数字证书、指纹等身份认证方式结合,只有通过认证后方可访问和恢复客户端计算机的数据及已备份数据。

安全存储

客户端经过USB 令牌认证后,其备份的数据使用USB令牌中保管的密钥加密整个备份集,并存储在介质服务器端。在打开备份集进行恢复时,只有通过对应USB 令牌认证后方可解密数据,即使存储备份数据的介质丢失,也无须担心泄密。

3.3.2 灾备系统审计功能

XXX备份软件提供基于企业审计管理员的灾备系统审计功能,通过此功能,可以了解更多信息:

安全审计:可以通过报表审计企业的数据保护情况;

行为审计:通过日志审计用户的行为(管理员和普通用户);

备份审计:通过恢复浏览审计备份数据的内容。

系统容灾解决方案

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。

容灾项目方案设计

容灾项目方案设计

目录

容灾技术规范 作为风险防范系统,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 计算机信息系统实现数据大集、应用大集中后,系统的运行安全成为风险控制的焦点。目前,已经有多系统开始或准备进行灾备系统的建设,灾备系统建设的目标是减灾容灾,使计算机信息系统和数据能够最大限度地防范和化解各种意外和灾害所带来的风险。然而,与大多数工程一样,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 可以说,风险防范系统本身也存在风险点,需要小心应对。 灾备系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同灾备级别对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有投资并提高灾备系统建设投资的利用率。 1.1 容灾的总体规划 1.2 真正的容灾是数据被不间断的一致性访问! 在灾难备份的世界里,是有等级观念的,级别不同,灾备系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对用户来说,明确灾备系统建设的总体规划十分必要。 1.2.1 技术指标RPO、RTO 衡量容灾技术的两个技术指标RPO、RTO RPO(Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原

电信核心业务系统容灾解决方案

电信核心业务系统容灾解决方案 Oracle 技术产品咨询顾问高壮志2004/05/24 随着电信运营商多年的系统建设,其核心业务系统的高可用性越来越受到人们的关注。从整个系统的角度来看高可用性,包括主机、操作系统、数据库、应用、网络设备等许多方面。而这些系统的一个显著特点就是以数据为中心,因此对数据的保护是整个系统高可用性的核心体现。Oracle数据库作为电信运营商核心系统的主流数据库,针对企业用户的重要数据、重要业务高可用性的需求提出了建立在数据库级别的容灾方案-- Oracle Data Guard (数据卫士)。 为什么要使用Data Guard 电信行业现有系统在容灾方面基本上有两种做法。一是采用备份的方法,即定期地将数据备份到硬盘和磁带上。这种方法的缺陷是实时性较差,恢复时间较长;另外备份设备和生产系统一般都处于同一物理位置,不能满足异地容灾的要求。另一种做法就是硬件镜像的做法,这种做法在硬件投资上较大,对两点间网络带宽有较大要求。鱼和熊掌,可否兼得?下面让我们来看看Oracle Data Guard解决方案。 Oracle Data Guard Oracle9i Data Guard 维护了一个或多个与客户生产数据的同步备份。Oracle9i Data Guard配置包括一个松散连接的系统集合,由一个生产数据库和若干备用数据库组成,形成一个独立、易于管理的数据保护方案。现有运营商的核心业务系统的数据库在物理位置上往往位于省信息中心或计费中心的机房内,如果在同一城市有其它机房或利用其它城市机房部署同步备份的数据库,通过Oracle网络服务连接到一起,就可以构成一个很好的容灾解决方案。在修改主数据库时,对主数据库更改而生成的更新数据即发送到备用数据库,这些更改在备用数据库被重新应用。当生产数据库出现故障时,备用数据库可以继续提供服务。 图1提供了一个例子。 图1简单的双工作区配置

数据中心容灾备份方案完整版

数据中心容灾备份方案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。 备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

集中备份容灾系统设计方案解析

数据集中备份容灾系统方案 目前,越来越多的集团企业依赖信息系统支撑其关键业务的开展,越来越多的企业在逐步重视容灾技术,将其作为企业在遭受灾难经历后保证企业尽快恢复业务的重要手段。但实际上,容灾(DT,Disaster Tolerance),或者灾难恢复(DR,Disaster Recovery)是企业保证其业务信息系统实现不间断运行的主要技术手段。企业的最终目的是实现业务连续性(BC,Business Continuity),即当企业面临危机和灾难时,能及时恢复正常,把损失降低到最低限度,保证业务的高可用性。许多企业发现,要尽可能地保证企业业务的连续性,仅仅在技术层面考虑是不够的,还需要制定和管理一系列方法、策略、流程、条件以及部门和人力资源调配方案等等,因此,现在大部分企业在业务连续性的层面上进行统一规划和实施。 具体来说,业务连续性是一种由计划和执行过程组成的策略,其目的是为了保证企业包括生产、销售、市场、财务、管理以及其他各种重要的功能完全在内的运营状况百分之百可用。相比之下,灾难备份只是一种尽可能减少宕机损失的工具或者策略。不过,灾难备份是业务连续性的基础,没有前者,后者就是空中楼阁,但是如果一个灾难备份系统使数据恢复正常的时间过长,那也就不存在所谓的业务连续性了,缩短这个时间,就是业务连续性的目标,消除这个时间,则是业务连续性的终极目标。 所谓灾难,通常指关键业务的信息服务中断,且中断的时间让人不能忍受。引起灾难的因素很多,可以是小系统中的硬件故障,还可以是因火灾、飓风、地震而引起的数据处理设备的损坏,只要造成了关键业务的中断,都是灾难。容灾就是为恢复计算机系统提供的保障,这些保障包括备份中心、备份设备和备份数据等。 从以上对容灾系统特点分析可以看出,目前系统还无法完成现有状况下的备份和容灾要求,其设计已经不能满足企业级用户日益缩减的备份窗口下海量数据的容灾备份需求,随着业务的发展,数据量将会更加庞大,以上问题也将日益突出,因此我们从容灾技术路线的比较来分析如何有效的解决以上问题

容灾备份-解决方案方法

容灾备份系统 2010-8-11 项目背景 随着计算机技术的快速发展,每个企业都在大量的使用计算机处理自己的核心数据,这些数据往往是企业生产经营必不可少的部分。依赖这些数据的计算机系统的停机往往会造成企业生产经营活动的停顿,给企业造成巨大的损失。所以,可以说,这些数据是企业的生命核心。

企业的IT 管理员为了保证生产经营活动的持续运行,不断的加强对系统和数据的保护,如使用基于双机的高可用技术,磁盘阵列系统的RAID 技术等。然而,人们依然无法 回避由于磁盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者 数据丢失。所以,数据备份作为数据保护的最后一道屏障,必不可少。 二、功能介绍 实时保护:连续捕获、实时备份数据变化,全过程保护数据安全。实现真正的持续性 数据保护(CDP),无需设置任何备份时间点,居国内外同类产品领先地位。 完善备份:同一软件可实现“数据库双机热备+接管”、“本地实时灾备” 、“异 地实时灾备” ,全方位保证数据库安全。 任意回退:可按任意操作步数或时间点进行数据回退。主数据库遭到破坏时,备份数 据库可将主数据库回退到损坏前最后时刻的状态,且能保证事件的完整性。 快速恢复:主数据库或表损坏,从站自动检测,提示回退的步数。恢复1个G数据 库在3-5分钟。 增量备份:只备份变化部分,在保障备份数据安全的同时减少备份的工作量。 错峰机制:在系统负荷极大时暂停备份以免系统瘫痪,当系统负荷下降时备份暂停 期间的数据,并重新开始实时备份。 低耗资源:对主数据库压力小,系统采用消息机制,只有灾数据库发生变化时才触 发,只传数据库的变化部分,不同于文件拷贝,和数据表的轮询。 操作简单:自主开发设计,着重考虑国内用户使用习惯,安装、设置非常简单。维护 方便:启动或连接中断后重连时,自动校验主从站数据,保证数据准确。 加密传输:底层通讯采用自主研发的通讯平台,所有数据都是用加密数据包进行数据 交换,充分保证数据安全。 高性价比:在各项性能领先的同时,价格远远优于国外软件。当选择不接管的热 容灾备份方式时,从站可采用低档Server 或高稳定性的PC(有足够的存储空间即 可),从而实现极低的总体成本。 通用性好:不对数据库中的应用做任何修改。与数据库中表的结构无关,且无任 何限制。对数据库备份完整:如TABLES(表)、DIAGRAM(S关系图)、VIEWS(视图)、USERS(用户)、ROLES、RULES等。

容灾整体解决方案

XX 容灾整体解决方案

第1章

前言................................................................................................................................................2

容灾整体解决方案 第2章 2.1 2.2 2.2.1 2.2.2 2.3 2.4 容灾概述........................................................................................................................................3
概述 ...........................................................................................................................................................3 业务连续性管理简介................................................................................................................................5 《规范》简介 .........................................................................................................................................5 恢复时间目标(RTO)与恢复点目标(RPO)...................................................................................8 容灾系统建设的流程..............................................................................................................................10 容灾系统中的人员组织安排..................................................................................................................12 第3章 容灾建设中 IT 技术的选择 ........................................................................................................14
3.1.1
容灾中 IT 技术的选择..........................................................................................................................14 主流厂商解决方案简介 ..............................................................................................................23
第4章 4.1.1 4.1.2 4.1.3
EMC 容灾解决方案简介 .....................................................................................................................23 SYMMENTEC|VERITAS 整体解决方案简介.....................................................................................26 HDS 容灾解决方案简介.......................................................................................................................29 京北方公司容灾解决方案 ..........................................................................................................32
第5章 5.1.1 5.1.2
京北方公司容灾建设分阶段论............................................................................................................32 京北方公司容灾体系各阶段推荐的产品及产品优势 ........................................................................32 附件..............................................................................................................................................35
第6章
1-

EMC VNX Replicator 容灾方案

EMC异地容灾方案 大家都知道NAS具有低TCO、扩充性、跨平台、高可用性、高速度、方便的安装、维护、使用等特点,但是廉价的NAS系统采用了以软件构建RAID的方式,当系统负荷较重的时候,NAS系统中的处理器性能瓶颈也会引发传输速率的明显下降,正因为这样许多企业在选购NAS的同时使用更加安全有效地存储备份方法,从而有效保证了数据的安全性。 什么是数据备份? 数据备份顾名思义就是将原有的资料重新复制进行保留,以便在特殊情况下可以重新利用。数据备份就像我们生活中的汽车备胎,一旦出现故障我们只要将备胎换上去就可以重新使用了。除了汽车备胎我们在生活中所使用的钥匙也都是备份思想的体现。我们要记住数据备份是最基础的,没有它一切先进的技术也都没有意义了。 数据备份的目的 很多人对数据备份有着错误的理解,认为只要将数据备份到本地就可以万事大吉了。肯定地说存在这种想法的人有很多,在实际生活中有很多案例证明了数据丢失后而不能正常恢复,这种灾难性后果可能会对金融及电信行业带来无法估量的损失。进行数据备份目的是将原有数据重新利用,但是在绝大部分情况下备份的数据是没有任何作用的。在实际工程中经常会遇到一些系统集成商向客户介绍他们的产品是如何的方便、可靠,但光有数据备份还不行,一旦出现故障必须将数据恢复才可以,一个不能恢复的备份对任何企业来说都是没有意义的。因此只有安全、可靠、高效地恢复数据,才是系统备份的真正目的。 数据备份在存储领域的地位 在SAN和NAS这些新的存储系统结构中,传统的备份技术在结构上也得到了长足的发展。数据备份作为存储领域的一个重点,其在存储系统中的地位和作用都是不可替代的。从LAN Free备份到无服务器备份,这些备份领域里的新兴技术正在日渐成熟和完善。对一个完整的IT系统而言,备份工作是其中必不可少的组成部分。之所以备份工作具有很大的意义,是因为它更像是我们为了留住美好时光而拍摄的照片或影片,把这些数据通过刻录等方式永久的保存了下来,供我们怀旧和欣赏。显然当然我们看到一张儿时的照片就回到从前的可能性根本没

六种数据库容灾方案

六种数据库容灾方案 1、经典方案,即双机ha,单盘阵的环境。 简单的说,双机热备就是用两台机器,一台处于工作状态,一台处于备用状态,但备用状态下,也是开机状态,只是开机后没有进行其他的操作。打个比方来说,在网关处架上两台频宽管理设备,将两台的配置设定为一致,只是以一台的状态为主,一台为次。主状态下的频宽管理设备工作,处理事件,次状态下的频宽管理设备处于休眠,一旦主机出现故障,备用频宽管理设备将自动转为工作状态,代替原来的主机。这就是“双机热备”。 2、单机双盘阵(os层镜像)。针对某些用户的双盘阵冗余的需求,我提出了在os层安装卷管理软件,用软件对两台盘阵做镜像的方案,但只有单机工作,一台盘阵挂了,因为os层的软raid的作用,系统仍然可以工作。 3、双机双柜(os层镜像)方案,这个方案,仍然是用os层做镜像,但是用了双机ha,这种方式有个尚未确认的风险,非纯软方式的ha要求主机有共享的存储系统。一台机器对盘阵lun做的镜像虚拟卷,是否也适用另一台主机,也就是说,a主机做的镜像,b主机接管后,是否会透明的认出a机做镜像之后的逻辑虚拟卷,如果ab两主机互相都能认,那么就是成功的方案!! 4、双机双柜(底层镜像)。这种方案,虽然共享的lun不是在一台物理盘阵上,但是被底层存储远程镜像到另一台盘阵上,能保持数据的一致性

5、双机双柜纯软方式HA。这种方案,主机装纯软HA软件,虽然纯软不需要外接盘阵,但是接了盘阵,照样可行。 6、双机双柜(hacmp geo),其实geo大体上就是个类似于纯软HA的软件。

数据库安全 (一)数据库安全的定义 数据库安全包含两层含义:第一层是指系统运行安全,系统运行安全通常受到的威胁如下,一些网络不法分子通过网络,局域网等途径通过入侵电脑使系统无法正常启动,或超负荷让机子运行大量算法,并关闭cpu风扇,使cpu过热烧坏等破坏性活动;第二层是指系统信息安全,系统安全通常受到的威胁如下,黑客对数据库入侵,并盗取想要的资料。 编辑本段 (二)数据库安全的特征 数据库系统的安全特性主要是针对数据而言的,包括数据独立性、数据安全性、数据完整性、并发控制、故障恢复等几个方面。下面分别对其进行介绍 1.数据独立性 数据独立性包括物理独立性和逻辑独立性两个方面。物理独立性是指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的;逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。 2.数据安全性 操作系统中的对象一般情况下是文件,而数据库支持的应用要求更为精细。通常比较完整的数据库对数据安全性采取以下措施: (1)将数据库中需要保护的部分与其他部分相隔。 (2)采用授权规则,如账户、口令和权限控制等访问控制方法。 (3)对数据进行加密后存储于数据库。 3.数据完整性 数据完整性包括数据的正确性、有效性和一致性。正确性是指数据的输入值与数据表对应域的类型一样;有效性是指数据库中的理论数值满足现实应用中对该数值段的约束;一致性是指不同用户使用的同一数据应该是一样的。保证数据的完整性,需要防止合法用户使用数据库时向数据库中加入不合语义的数据 4.并发控制 如果数据库应用要实现多用户共享数据,就可能在同一时刻多个用户要存取数据,这种事件叫做并发事件。当一个用户取出数据进行修改,在修改存入数据库之前如有其它用户再取此数据,那么读出的数据就是不正确的。这时就需要对这种并发操作施行控制,排除和避免这种错误的发生,保证数据的正确性。 5.故障恢复 由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。数据库系统能尽快恢复数据库系统运行时出现的故障,可能是物理上或是逻辑上的错误。比如对系统的误操作造成的数据错误等。 SQL server数据库安全策略 SQL Server2000[1]的安全配置在进行SQL Server2000数据库的安全配置之前,首先必须对操作系统进行安全配置,保证操作系统处于安全状态。然后对要使用的操作数据库软件(程序)进行必要的安全审核,比如对ASP、PHP等脚本,这是很多基于数据库的Web应用常出现的安全隐患,对于脚本主要是一个过滤问题,需要过滤一些类似“,;@/”等字符,防止破坏者构造恶意的SQL语句。接着,安装SQL Server2000后请打上最新SQL补丁SP3。 SQL Server的安全配置 1.使用安全的密码策略 我们把密码策略摆在所有安全配置的第一步,请注意,很多数据库账号的密码过于简单,这跟系统密码过于简单是一个道理。对于sa更应该注意,同时不要让sa账号的密码写于应用程序或者脚本中。健壮的密码是安全的第一步,建议密码含有多种数字字母组合并9位以上。SQL Server2000安装的时候,如果是使用混合模式,那么就需要输入sa的密码,除非您确认必须使用空密码,这比以前的版本有所改进。同时养成定期修改密码的好习惯,数据库管理员应该定期查看是否有不符合密码要求的账号。 2.使用安全的账号策略 由于SQL Server不能更改sa用户名称,也不能删除这个超级用户,所以,我们必须对这个账号进行最强的保

DR容灾网关--技术方案(本地灾备 简要)

为满足核心业务、数据的保护,本次灾备建设方案主要对多台Windows、Linux服务器及虚拟机服务器镜像保护。采用基于柏科DR容灾网关系统实现数据灾备解决方案:使用DR容灾网关对核心数据进行镜像,采用快照实现数据的逻辑错误恢复,采用一键式P2V启动功能实现操作系统的快速恢复;在本地信息中心,使用数据容灾网关特有的备份、归档功能对数据进行离线保护,最大程度对数据进行全方位的保护。 数据镜像 FC-SAN 数据镜像 部署说明 在生产中心部署一套DR3300容灾网关,利用DR3300容灾网关的数据镜像、智能快照、CDP持续数据保护、远程复制等技术实现本地应用级灾难接管。 ●架构规划 在生产中心增配一台DR容灾网关系统,DR容灾网关采用旁路非侵入式部署,只需加入FCSAN存储网络,即可以对生产中心多台服务器本地硬盘的操作系统、应用及核心存储数据进行保护,实现本地数据容灾保护。 在生产中心配备用虚拟化平台,可在本地系统出现故障时,5分钟内实现P2V 应用级业务接管。 ●业务及数据保护 客户端代理:在生产中心受保护服务器上安装客户端磁盘Agent映像代理软

件,将中心服务器硬盘数据或磁盘阵列数据镜像到DR容灾网关中。DR容灾网关通过磁盘Agent代理软件与这些应用程序集成或被直接调用,有相关的代理程序驱动数据库进入静止状态来做快照,来保证数据的一致性。 数据镜像:将DR容灾网关分别与应用服务器连接并分配相应的保护数据卷,满足各应用服务器数据的保护需求。平时对核心服务器的系统卷和数据卷均做镜像(MIRROR),通过磁盘镜像技术可以防止核心磁盘存储系统或服务器磁盘故障,发生故障时可以直接用DR容灾网关接替工作,对外提供服务,数据零丢失快照保护:通过对镜像的数据快照保护,保证了一体化保护设备上面保存了各应用服务器关键数据的多个历史副本,从而在发生逻辑错误(人为误删除、病毒感染、软件故障等)时可以快速恢复数据,重新起用应用。 数据的一致性保证: Oracle、MSSQL等都是结构化数据库,DR容灾网关快照与这些应用程序集成或被直接调用,有相关的代理程序驱动数据库进入静止状态来做快照,来保证数据的一致性。 持续I/O数据保护:对每个I/O操作进行持续“录像”保护,如果发生的是误删除、数据文件病毒感染、数据库损坏、数据不一致等情况,可恢复最近任意时间点的数据,数据丢失量(RPO)达到秒级。 远程数据复制:可以通过IP网络采用加密压缩和精简复制技术,将本地生产中心数据完整地复制到异地的DR容灾网关设备上,实现真正的异地容灾系统,使用精简灾备和数据压缩等传输技术,数据传输带宽只需要传统灾备1/8-1/32,传输成本大为降低。(后期可升级建设灾备站点) 灾难恢复 对数据存储的保护:如果本地生产中心核心磁盘存储系统故障,可以直接用DR容灾网关接替工作,对外提供服务,在数据“零”丢失的同时保证业务的连续性,避免了原有存储系统的单点故障。 远程启动功能:如果本地服务器操作系统故障,可用通过DR容灾网关SAN BOOT功能实现远程启动恢复操作系统和应用系统,防止操作系统和应用系统的故障。

某公司系统容灾解决建设方案

某公司软件容灾方案 1容灾软件 Symantec 的存储管理软件VERITAS Storage Foundation(简称SF)适用于企业存储管理的标准化平台,它不仅提供比操作系统本身逻辑卷管理器更加强大的在线卷管理功能,还提供许多高级的存储管理功能,其中包括用于容灾的数据镜像、数据复制等功能。是目前市场上广泛使用的容灾软件。 Symantec VERITAS Cluster Server(简称VCS)是一个用于容灾演练、应用级容灾的软件。它是在基本的HA软件功能的基础上发展而来的。 Veritas Storage Foundation 软件可以根据企业不同需求,提供不同的容灾解决方案,小到同城数据镜像,大到两地三中心数据容灾。SF与VCS紧密集成,可以提供完整的、从数据到应用、并自动实时演练的企业容灾方案。 铁道部高铁指挥实验系统采用了SF/VCS实现了容灾。

2数据同城镜像方式 利用灾备中信和主中心之间或者同机房内的裸光纤线路构成SAN环境,直接采用Storage Foundation在两个存储之间实现存储镜像。即所有数据都将同时写入两边的磁盘整列中。 如上图所示,主中心的服务器将应用的每个写i/o数据同时写入到两个中心的存储中。由于镜像的实现是依托于底层的Volume,所有数据存取的过程对于应用来说都是透明的。我们可以通过设臵Volume Manager的读取策略来指定主中心的服务器从本地的磁盘阵列上读取数据,加快数据查询的速度。 在这个场景中,数据发生物理错误的可能性基本上分为两种,生产中心的存储系统出现物理错误,如硬盘问题、光纤卡问题、光纤连接问题或光纤交换机问题等,另外一种就是整个数据中心出现故障。

XXX系统维护及机房运维综合管理方案

运 维 服 务 方 案 2016年5月18日

XXX系统维护及机房运维方案 二零一七年六月

目录 1 服务内容 (3) 1.1 服务目标 (3) 1.2 信息资产统计服务 (3) 1.3 网络、安全系统运维服务 (4) 1.4 主机系统运维服务 (6) 1.5 存储系统运维服务 (10) 1.6 数据安全存储及灾备运维服务 (11) 1.6.1 传统的灾备方式 (11) 1.6.2 容灾方案的关键指标 (13) 1.6.3 常见的备份策略 (14) 1.6.4 容灾的核心问题 (15) 1.6.5 容灾的实现方式 (16) 1.6.6 异地容灾技术 (18) 1.6.7 灾难恢复级别 (20) 1.7 容灾建设方式 (21) 1.7.1 企业信息系统保护层次 (21) 1.7.2 容灾技术模型 (23) 1.7.3 业务平台的保护---业务处理能力的冗余 (23) 1.7.4 数据平台的保护---业务状态数据的复制 (24) 1.7.5 接入平台冗余和贴换 (24) 1.7.6 容灾模式 (24) 1.7.6.1 容灾层次 (25) 1.7.6.2 容灾范围 (25) 1.7.6.3 同级容灾或降级容灾 (26) 1.7.6.4 容灾技术概述 (27) 1.7.6.5 基于存储的数据复制技术建设容灾系统 (28) 1.7.6.6 小结 (31) 2 运维服务流程 (32) 3 服务管理制度规范 (34) 3.1 服务时间........................................................................... . (34) 3.2 行为规范............................................................................. .. (34) 3.3 现场服务支持规范................................................................. . (35) 3.4 问题记录规范.......................................................................... ................................................ .35 4 应急服务响应措施................................................................... (37) 4.1 应急基本流程................................................................................................................................ ..37 4.2 预防措施......................................................................................... .............................. . (37) 4.3 突发事件应急策略 (38)

系统容灾技术方案大全

系统容灾技术方案大全

目录 一、数据中心灾备系统的分类 (3) 二、数据库远程复制和异地容灾方案相关分析 (11) 三、数据备份与数据容灾 (14) 四、重复数据删除成就异地容灾 (15) 五、金税工程三期背景下省级容灾备份建设探索 (22) 六、安徽中烟数据集中容灾系统建设实践与探索 (36) 七、推荐九个容灾解决方案 (42) 八、推荐九个容灾解决方案 (42) 九、GDS灾难恢复解决方案 (62) 十、多级企业数据容灾解决方案对比 (65)

一、数据中心灾备系统的分类 摘要:本文为大家讲述数据中心的一些技术知识,具体为您讲述数据中心灾备系统的 分类情况。 1.数据级容灾和应用级容灾 按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。 数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。 (1)数据级容灾。通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程数据复制技术问题;同步与异步容灾问题。 (2)应用级容灾。应用级容灾能保证业务的连续性。在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。

双机容灾系统建设方案建议书

双机容灾系统建设方案建议书

第一章纯软方式双机热备系统建设方案提示:因为纯软双机只支持Windows平台,如不改变现有服务器的Linux操作系统,请跳过本章 由于上述的建设双机系统的必要性和双机系统数据的重要性,就需要搭建一个非常适合双机系统运行和数据存储的平台,以此来保障双机系统安全、高效的运行。只有这样,才能充分发挥双机系统在企业的核心作用,从而全面提升企业的竞争力和生产力。 结合贵方的需求和现状,我们设计一款纯软方式的解决方案,以供参考。 图4.1 拓扑结构图 1.1方案描述 使用用户原有得两台业务服务器,构成一对双机。因为纯软双朵只支持Windows平台,所以需要将两台服务器全部改成Windows 系列操作系统,将原Oralce 9i数据库改成Windows平台版本Oracle数据库。两台服务器通过双机软件组成双机热备系统,双机中任何一台机器发生故障的情况下,由备机接管相应的IP地址、主机名、数据库服务及业务应用。 硬件要求:两台服务器的配置相同(CPU、内存和磁盘分区的类型、大小),

同时配置双网卡 网络环境要求:两台服务器安装相同的操作系统、数据库、应用程序及服务将两台服务器部署到企业的以太网中,分别将两台服务器中的一块网卡设为业务网卡,并分配固定的物理IP地址。将两台服务器的另一块网卡作为心跳网卡,通过一条心跳线相连。两台服务为一主一从的关系,主机为当前业务服务器,从机为灾备业务服务器。主机上的业务数据会被双机软件通过心跳线同步到从机。 通过双机软件虚拟一个业务IP地址,对外提供服务。绑定在主机IP址上,当主机发生故障时,再自动切换到从机物理IP地址上进行绑定。同时,接管数据库服务,应用程序服务等相关业务服务。双机软件以一定时间频率通过心跳线从主机发送验证信息到从机,检验主机是否运行正常,当主机的IP地址,数据库服务,数据存储区三者之一发生问题,双机软件会认为主机业务已停止,需要从机进行业务接管。同时停止主机的服务,开启从机服务。 当主机需要进行系统维护,系统升级,硬件安装等操作时,可手动将业务切换到从机上。当操作完成时,再将数据同步回主机并将业务切换到主机上。 1.2本方案采用双机软件的特性 ●双机软件的产品和服务能够使信息不间断,它通过一个接近无缝的 处理来管理和保护贯穿一个企业的数据。 ●基于双机软件的高可用性和高可靠性,我们选择它作为核心信息系 统和数据库服务器的双机切换软件。

容灾备份解决方案

容灾备份系统简介 2010-8-11 项目背景

随着计算机技术的快速发展,每个企业都在大量的使用计算机处理自己的核心数据, 这些数据往往是企业生产经营必不可少的部分。依赖这些数据的计算机系统的停机往往会造 成企业生产经营活动的停顿,给企业造成巨大的损失。所以,可以说,这些数据是企业的生 命核心。企业的IT管理员为了保证生产经营活动的持续运行,不断的加强对系统和数据的保护,如使用基于双机的高可用技术,磁盘阵列系统的RAID技术等。然而,人们依然无法 回避由于磁盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者数据丢失。所以,数据备份作为数据保护的最后一道屏障,必不可少。 、功能介绍 ■实时保护:连续捕获、实时备份数据变化,全过程保护数据安全。实现真正的持续性数据保护(CDP,无需设置任何备份时间点,居国内外同类产品领先地位。 ' 完善备份:同一软件可实现“数据库双机热备+接管”、“本地实时灾备”、“异地实时灾备”,全方位保证数据库安全。 E 任意回退:可按任意操作步数或时间点进行数据回退。主数据库遭到破坏时,备份数据库可将主数 据库回退到损坏前最后时刻的状态,且能保证事件的完整性。 ■ 快速恢复:主数据库或表损坏,从站自动检测,提示回退的步数。恢复1个G数据库在3 -5分钟。 ' 增量备份:只备份变化部分,在保障备份数据安全的同时减少备份的工作量。 ' 错峰机制:在系统负荷极大时暂停备份以免系统瘫痪,当系统负荷下降时备份暂停期间的数据,并重新开始实时备份。 ' 低耗资源:对主数据库压力小,系统采用消息机制,只有灾数据库发生变化时才触发,只传数据库的变化部分,不同于文件拷贝,和数据表的轮询。 ' 操作简单:自主开发设计,着重考虑国内用户使用习惯,安装、设置非常简单。 丄维护方便:启动或连接中断后重连时,自动校验主从站数据,保证数据准确。 ' 加密传输:底层通讯采用自主研发的通讯平台,所有数据都是用加密数据包进行数据交换,充分保证数据安全。 ' 高性价比:在各项性能领先的同时,价格远远优于国外软件。当选择不接管的热容灾备份方式时,从站可采用低档Server或高稳定性的PC (有足够的存储空间即 可),从而实现极低的总体成本。 ' 通用性好:不对数据库中的应用做任何修改。与数据库中表的结构无关,且无任 何限制。对数据库备份完整:如TABLES(表)、DIAGRAMS关系图)、VIEWS(视图)、 USERS(用户)、ROLES RULE等。

数据容灾备份设计方案

数据容灾备份设计方案 1.1数据备份的主要方式 目前比较实用的的数据备份方式可分为本地备份异地保存、远程磁带库与光盘库、远程关键数据+定期备份、远程数据库复制、网络数据镜像、远程镜像磁盘等六种。 (1)本地备份异地保存 是指按一定的时间间隔(如一天)将系统某一时刻的数据备份到磁带、磁盘、光盘等介质上,然后及时地传递到远离运行中心的、安全的地方保存起来。 (2)远程磁带库、光盘库 是指通过网络将数据传送到远离生产中心的磁带库或光盘库系统。本方式要求在生产系统与磁带库或光盘库系统之间建立通信线路。 — (3)远程关键数据+定期备份 本方式定期备份全部数据,同时生产系统实时向备份系统传送数据库日志或应用系统交易流水等关键数据。 (4)远程数据库复制 生产系统相分离的备份系统上建立生产系统上重要数据库的一个镜像拷贝,通过通信线路将生产系统的数据库日志传送到备份系统,使备份系统的数据库与生产系统的数据库数据变化保持同步。 (5)网络数据镜像 是指对生产系统的数据库数据和重要的数据与目标文件进行监控与跟踪,并将对这些数据及目标文件的操作日志通过网络实时传送到备份系统,备份系统则根据操作日志对磁盘中数据进行更新,以保证生产系统与备份系统数据同步。 (6)远程镜像磁盘 利用高速光纤通信线路和特殊的磁盘控制技术将镜像磁盘安放到远 …

离生产系统的地方,镜像磁盘的数据与主磁盘数据以实时同步或实时异步方式保持一致。磁盘镜像可备份所有类型的数据。备份拓扑网络结构1.2(即东风东路院区中心机广州市第八人民医院具有两个不同地点的中心机房房和嘉禾院区中心机房),在这基础上是可以构建一个异地容灾的数据备份系统,以确保本单位的系统正常运营及对关键业务数据进行有效地保护,以下设计方案仅提供参考。嘉禾院区数据中心东风东院区数据中心 本方案中,我们采用EMC的CDP保护技术来实现数据的连续保护和容灾系统。 1.在东风东院区数据中心部署一台EMC 480统一存储平台,配置一个大容量光纤磁盘存储设备,作为整个系统数据集中存储平台。 2.在嘉禾院区数据中心部署一台EMC 480统一存储系统,配置一个大容量光纤磁盘存储设备,作为整个平台的灾备存储平台。 ) 3.两地各部署两台EMC RecoverPoint/SE RPA,采用CLR技术,即CDP(持续数据保护)+CRR(持续远程复制),实现并发的本地和远程数据保护。 4.在东风东院区数据中心本地采用EMC RecoverPoint/SE CDP(持续数据保护)技术实现本地的数据保护。. 5.两地采用EMC RecoverPoint/SE CRR(持续远程复制)技术,实现远程的数据保护。由于两地之间专线的带宽有限,可以采用EMC Recoverpoint/SE异步复制技术,将东风东院区数据中心EMC480上的数据定时复制到嘉禾院区数据中心。根据带宽的大小,如果后期专线带宽有所增加,RecoverPoint会自动切换同步、异步、快照时间点三种复制方式,尽最大可能保证数据的零丢失。 1.3本地数据数据保护(CDP)设计

相关主题