容灾系统建设方案.pdf

上传人:ylj18****70940 文档编号:72826350 上传时间:2023-02-13 格式:PDF 页数:28 大小:1.90MB
返回 下载 相关 举报
容灾系统建设方案.pdf_第1页
第1页 / 共28页
容灾系统建设方案.pdf_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《容灾系统建设方案.pdf》由会员分享,可在线阅读,更多相关《容灾系统建设方案.pdf(28页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 xxxxxxx 应用容灾 系统建议方案 2 目 录 1。用 户 需 求 及 针 对 本 需 求 的 容 灾 系 统 设 计 综 述 .3 1。1 应 用 数 据 安 全 级 别 的 分 级 考 虑 .3 1。2 用 户 需 求 分 析:.4 1.3 本 项 目 中 需 要 注 意 的 几 个 要 点 .5 2。数 据 容 灾 系 统 的 详 细 设 计 .8 2.1 系 统 设 计 原 则 .8 2。2 系 统 的 产 品 选 择 .8 3.3 灾 备 中 心 的 组 建 .10 2.4 数 据 容 灾 系 统 的 基 本 结 构 .11 2。5 数 据 的 远 程 复 制 流 程 .13

2、2。6 数 据 的 远 程 恢 复 流 程 .14 2.7 本 容 灾 系 统 的 结 构 特 点.17 2.8 数 据 容 灾 系 统 扩 展 .18 2.9 系 统 投 资 保 障 .18 3.数 据 容 灾 系 统 与 其 他 方 案 的 简 要 比 较 .18 4.数 据 容 灾 系 统 的 实 施 计 划 .20 4.1 系 统 实 施 需 求 规 划 .20 4.2 相 关 性 要 求/实 施 步 骤 .21 4.3 系 统 配 置 清 单 .23 5.数 据 容 灾 系 统 的 测 试/验 收 计 划.23 5。1 基 本 测 试 及 对 ORACLE和 其 他 类 型 数 据

3、的测 试 .24 5.2 切 换 及 回 切 的 测 试 .25 5。3 故 障 测 试 .26 6。数 据 容 灾 系 统 的 日 常 管 理/演 练 计 划 .26 7。应 用 级 容 灾 的 规 划 .27 8.后 续 其 他 节 点 的 扩 展 规 划 .27 10。EMC RECOVERPOINT 的 维 护 .27 附 件 一:美 国 EMC 公 司 简 要 介 绍 .错误!未定义书签。3 xxxxxxx 应用容灾系统建议方案 1。用户需求及针对本需求的容灾系统设计综述 xxxxxxx 当前的应用 系统类别较多,包括 了办公及业务等多个 方面。在平台上包括 Windows 及当前主

4、流的多种 UNIX,在存储体系上也具有多种型号的存储产品。因此,整个系统的复杂程度较大.同时,由于应用系统一经处于比较完善的程度,因此,任何的调整都将带来很大的影响。为此,为了确保数据的安全性,在早期用户实施了数据的磁带备份,但对于关键数据来说,这种磁带备份还不能够完全满足系统抵御各种灾难的能力。为此,用户考虑对数据实施灾备计划.数 据 的 容 灾 保 护 提 供 最 基 本 的 容 灾 底 线 保 证,确 保 在 任 何 预 计 之 外 的 灾难 发 生 后,业 务 系 统 都 可 以 在 允 许 损 失 极 少 量 数 据(或 无 损 失)的 情 况 下,在一定的时间内恢复,数据容灾同时也

5、是应用逻辑错误和数据库软件 bug 的容灾应对出发点;可以通过一定的方式来恢复到这种故障之前的可用的状态。1。1 应用数据安全级别的分级考虑 鉴于当前存在的大量数据,在安全性的要求上建议分出不同的优先级别,建立不同安全级别的保护措施。这样不仅在成本上会带来优势,同时也可以确保最关键数据的不丢失。这 种 分 级 保 护 一 般 根 据 可 以 承 受 的 数 据 丢 失 量(如 半 小 时,或 一 天)来 考虑。我们不妨把不允许有任何数据丢失的应用定义为安全级别最高,要求进行实时的同步的数据远程传输,对于相对来讲数据安全级别稍低者可以把数据传输的优先级别作相对较低的配置,从而确保在同一时间优先发

6、送最为关键的应用数据。而对于数据安全要求一般的数据来说,建议采用本地的磁带备份即可,而不必纳入到灾备的体系中来。这样不仅可以合理使用资金,同时也可以确保关键数据的最高级别保护。4 1.2 用户需求分析:用户资料采集:xxxxxxx 当前 SAN 环境(图)用户需求分析:1)数据的实时远程复制 针对关键业务系统数据实现数据的实时的远程复制,从而保障数据在本地发生各种故障之后首先可以保障数据的完整性,并可以通过一定的途径快速得以恢复,或者根据情况在远程直接启动应用。2)灾备数据的可处理性,包括对数据的读写操作。所谓的读操作,是指灾备数据可以为其它的某些临时的应用提供便利,支持对这些数据的读操作。从

7、而可以方便地验证灾备体系的工作是否正常,或者在必要的时候利用这些数据进行诸如员工培训、软件调试、相关系统的引用等多种处理。所谓的数据读写操作,是考虑利用灾备数据提供诸如员工培训、系统应用测试、后续软件调试或其他临时应用的可能.这样,可以为上述应用带来最大的便利性。但是,为了保持和原始数据的一致性,系统应该支持上述写入操作的 Reset(重置)操作,使得在上述任务结束后,可以方便地把数据恢复到OAWEBDELL6650*2DELL6650*2HPDS20*2HP DL580两全UNIX-oracleDELL 2650备份服务器Brocade 3900Brocade 3900SUN 6800*2物

8、流DELL|EMC CX600新增盘柜DELL PowerVault136TDELL|EMC CX400DELL|EMC CX700IBM690*2OLAP oracleIBM690*2*21,OLTP oracle,db22,portal 5 没有进行写入操作之前的状态,维持灾备数据和源数据的严格一致。另外一个方面,数据的读写支持,也可以很方便地验证灾备体系的工作是否正常。当 然,这 种 读 写 操 作 必 须 要 对 数 据 的 远 程 复 制 和 本 地 的 应 用 不 产 生 任 何影响。2)(远期)应用的可切换支持.灾 备 中 心 不 应 该 作 为 纯 粹 的 备 用 系 统,在

9、提 供 诸 如 数 据 查 询 等 应 用 的 同时,还要提供自动的应用切换等支持,一旦在生产中心发生故障后,灾备中心的关键系统可以自动接管生产系统,提供持续的应用保障。这种规划建议作为远期的目标之一,当前建议只以数据的远程复制为主,但当前的方案必须要考虑到本要素。1.3 本项目中需要注意的几个要点 通过在对用户的具体环境和需求作了细致的分析之后,我们认为用户对该数据容灾系统给以了充分的重视,所提出的观点和要求是十分详细和具体的,在此,从我们方案提供商的角度,对此作如下的概括,便于整体方案的分析。方案的通用性。这种通用性体现在两个方面:一是异构平台、存储设备的支持性,二是对 不 同 应 用 类

10、 型 数 据 的 适 用 性,只 有 这 样 的 方 案 才 可 以 较 好 地 保 障 用 户 当 前投资,达到与应用类型无关、与平台无关以及与磁盘阵列等存储设备无关的适用性最广的解决方案。在当前,数据主要以 Oracle、DB2、SQL2000 类型为主,但是随着应用类型的增加,产生不同类型数据的可能性还是很有可能的。如果现在选用了仅仅支持如 Oracle 数据的解决方案,那末临时性的其他数据将无法得到及时的复制,或者今后的应用扩展将受到很大的制约.实时的数据复制解决方案。我们认为最终用户已经对不同应用数据的安全性要求做出了很好的分析和划分,其中关键数据要求不丢失,或尽量少地丢失。因此,我

11、们认为必须要采 用 真 正 的 实 时 的 数 据 复 制 解 决 方 案 才 可 以 满 足 这 种 要 求.在 条 件 具 备 的 情况下,应该做到无延迟数据复制.而建议采用非实时或准实时复制方案。灾备数据的可用性 分为两个方面,一是数据的实时复制的可靠性,要求复制数据要和源数据保持严格一致,严格按照源数据的写入顺序进行复制,使得灾备数据具有可 6 用性.二是在需要的时候可以很便利地对灾备数据进行读写操作,但是,这种读 写 操 作 不 应 该 对 数 据 的 实 时 复 制 产 生 影 响。还 有,在 对 灾 备 数 据 进 行 修 改(如进行员工培训、软件测试等操作时对数据的采集或调整测

12、试)后可以恢复到原有状况,从而确保数据的一致性和安全性.扩展的便利性 包括对当前和今后其他应用类型数据的实时复制的扩展,复制距离的扩展 以 及 复 制 节 点 数 量 的 扩 展 等 多 个 方 面,在 当 前 选 择 方 案 的 时 候 面 对 未 来 的需求进行全面考虑。数据的丢失量 对于关键应用要求数据不丢失,因此,不建议采用诸如当前在主机上开辟一定的缓存(Buffer)空间,用来存放待复制的数据,利用异步的方式发送到远程.这样的产品无疑会因为各种原因导致数据的丢失率较大,如当主机资源意外掉电或宕机时,上述 Buffer(缓存)中的数据必然会被丢失。我们推荐在主机产生写入操作的同时数据被

13、发送出去,这样,数据始终保持和本地的写入同步,这样的方案才可以真正做到数据的无丢失。数据的可回滚性(最新数据不可用情况下的数据恢复支持)不可避免地会在某些情况下,最新复制的数据不可用的情况下,尤其对于 Oracle 数据库,很可能在管理员发现故障时,其内部已经在几分钟之前就已经出现了 问题,那末,被复制过 去 的数 据肯 定也是不 能够被 使用 的.此时,我们必须要具有数据的回滚性支持,比如可以往前回滚 30 秒、1 分钟或 2 分钟,并利用这些数据获得可用数据同时数据的丢失量最小化。灾备自身系统实施及恢复的便利(简易)性 灾 备 系 统 的 实 施 不 应 该 对 现 有 的 应 用 系 统

14、 作 任 何 调 整,尤 其 是 对 当 前 运行较稳定的系统。当然,即使需要一定的调整。那末。这种调整夜必须是系统管理员可以理解并接受的。同样,对于灾备系统自身而言,发生问题后的解决或全面的恢复也要简易化,要支持如 WEB 管理,图形化管理,而不应该需要较复杂的配置.否则,今后如果需要作系统调整,那末,系统管理员将无法面对这种配置和管理,甚至导致日常的维护也不敢动手的现状。对系统的影响最小化 由于当前应用系统的完善性和稳定性,不建议为了本灾备系统而对当前 7 的应用系统做任何方面的调整。主机资源不能够因为灾备系统的实施而显得紧张,包括内存、CPU 等资源的占用应力求最小化。当然这种影响我们认

15、为同样包括实施时候对系统、对数据库、对应用的调整合对存储空间的调整等多个方面.灾备方案要支持策略化配置 便于不同的应用数据具有不同的复制优先级别,以确保关键数据不丢失.灾备系统的管理简易性 为了确保灾备系统的正常运行,在日常的管理中必须要进行一定的演练,以保障需要时候的迅捷相应和确认灾备系统可用性。那末,这种日常的演练活 动 必 须 要 简 单,也 就 是 灾 备 系 统 自 身 必 须 要 具 有 简 易 的 人 性 化 的 管 理,同时,在对灾备数据作验证时不应当对生产系统产生任何影响。还有,系统自身故障后应该具有很便利的方式直接来恢复,而不需要重新配置。灾备数据具有不影响复制的读写支持,

16、同时支持写入操作后的 Reset(数据重置)为了充分利用灾备数据,方案必须要支持对灾备数据的读写,同时,该读写的过程不应该影响数据的继续复制.这样,我们可以利用灾备数据进行诸如软件调试、员工培训、系统测试、灾备系统测试、演练等多种操作。但是,一旦在这种练习结束后,必须要要保证灾备数据恢复原样,保持和实际数据一致。相关故障的自恢复故障报警功能 系统涉及到大量的专业设备或技术,因此,灾备系统必须要具有很强的相关故障自恢复功能.如 WAN 故障、主机故障、应用系统故障等相关因素在恢复正常后,灾备系统也应该自动恢复运行,保持数据的实时复制。另外,灾备系统自身应该具有完善的日志和报警机制,减轻管理员的负

17、担。灾备系统具有较强的数据传输性能(如高度的压缩等能力)由于系统基于 IP 链路设计,因此,必须要具有很高的数据传输能力,才可以保障在有限的带宽资源环境下提高数据的复制性能。这种性能的提高很大程度上是靠较高的压缩率来时实现的,我们建议灾备系统要具有超过 10 倍的压缩率。8 2.数据容灾系统的详细设计 2.1 系统设计原则 在基于当前的先进技术及产品的情况下,结合整体造价,提供最高性价比的整体解决方案是我们这次规划的主要原则。同时在遵循用户提出的设计原则的前提下,我们还充分考虑了如下的设计理念:最高 的性 价比。根据 用户 应用 的实 际 需求,提供 适宜 的解 决 方案,在有限 的资 金许

18、可 范围 内,提供 符合 上述 需 求 的方 案,并降 低 后续 的维护成本,从而提高系统的整体性价比。实时的数据复制,数据丢失率最小化。策略 化的 数据 复制,保 障关 键应 用和 一般 应 用数 据的 优先 级别 策 略化,确保关键数据不丢失。严格的数据一致性.灾备 数据 的可 读 写支 持,在进 行读 写 的同 时不 影响 正常 的 数据 复制,灾备数据在被操作后致支持重置,确保与原数据一致.基于 WEB、GUI(图形管理)及 CLI(命令行)多种管理方式.对应用系统影响最小化;自身故障对应用系统无影响。实施便利,无须对应用作任何调整.广泛 的适 用性,数据 复制 和应 用类 型、数 据

19、类 型没 有 任 何 关系,支持异构的平台和存储设备.高性能的数据传输,具有高度的数据压缩率(高于 10 倍),提高数据复制性能。2。2 系统的产品选择 我们选用业界最领先的美国 EMC 公司的 RECOVERPOINT 产品作为本系统数据的实时复制(容灾)产品。EMC 公司总部在美国 加利福尼亚州,在美 国纽约、圣何塞(硅 谷)及以色列具有研发基地,专门致力于数据安全解决方案的技术研发。在数据容灾日益成为大家关注的话题的同时,EMC 推出了新一代的数据复制解决方案.大体来说,美国 EMC 产品具有如下的基本特点:提供实时的数据复制保障,确保在各种故障发生的情况下数据的完整性。便于实现应用的远

20、程容灾。支持异构存储和异构服务器平台。9 这种功能的实现便于用户提供对当前及未来存储设备投资的保障,最大程度地适应存储设备的多样性,避免在今后磁盘阵列的扩展成为被限制的一个方面。相反,目前大多的数据容灾解决方案均是以磁盘阵列为基础进行复制,要求本地和远程具有相同的磁盘阵列类型。基于标准 IP 网络进行数据复制,同时采用智能化带宽缩减技术来实现对带宽需求的空前降低。目 前 的 数 据 复 制 方 案 均 要 求 在 本 地 和 远 程 之 间 通 过 专 线 连 接,这 样 无 疑会带来巨大的成本要求。而 EMC 的解决方案可以基于 IP 网络,同时具有带宽约减技术(较高的数据压缩率),策略化地

21、实现数据和应用对当前带宽的适应性。策略化的数据复制解决方案,支持全面的数据保护服务级别.不同的应用数据具有不同的安全级别,因此,在数据复制的同时也可以按照不同的应用给以不同的策略设置,确保关键数据的安全。如用户可以定义关于延迟、带宽等方面的策略,使得用户可以在性能、安全和成本之间均衡考虑.同步、异步以及时间点多种模式的数据复制方式动态全面支持.RECOVERPOINT 提供了无数据丢失的保护措施.一台主机应用每次进行到本地磁盘子系统的写处理时,会并行处理写操作到本地的 EMC 设备。EMC应用这种同步连接,并利用独特的缓冲(Buffer)来移交最新的数据保护级别,达到无数据丢失的保护。EMC

22、的缓冲被内置在设备内,可以被置于远远超过光纤所能达到的距离之外。利用快照历史可以允许恢复到任一时间点的数据状态.除了可以保持始终一致的数据复制之外,EMC 还提供了独特的回滚能力:“小径快照”提供频 繁 的基于几秒 间隔的快 照能力,这 样可以实 现到任何时间点(point-intime)的数据恢复。在最新数据被破坏的情况下,可以从快照历史库中选择最近的一次完好可用的快照数据快速恢复到刚刚故障之前的状态。这 一 极 有 价 值 的 能 力 非 常 引 人 注 目 地 减 少 了 数 据 丢 失 以 及 对 数 据 崩 溃 的 保护。在一定的程度上 EMC 提供的该功能可以代替数据备份技术,甚至

23、远远超过了后者.企业级高可用及可扩展性支持 在每个节点通过放置两台 RECOVERPOINT 产品,可以达到自动化的冗余设计,实现数据复制应用的高可用.唯一的真正“out-ofband”技术的采用使得实施简单易行,同时对应 10 用的影响最小化。EMC 基于智能化 outof-band 的一种设备,可以连接到 SAN 和 IP 结构中。也就是说,这种数据复制的过程是在数据路径之外的,以一种非入侵的方式进行。因此,EMC 的实施出人意料的简单易行,另外,与 in-band 产品相比,EMC 的 out-ofband 解决方案提供了无限制的扩展能力,同时对应用无任何潜在的影响。远程数据的可用性支持

24、 EMC 提供的复制解决方案支持远程数据的可操作性,包括读写。这样某些特定的操作如生产数据的模拟化联系,软件的调整测试、系统开发测试、新 软 件 的 升 级 测 试 等 等 都 可 以 在 这 些 基 础 上 进 行 首 先 测 试,确 保 没 有 问 题 之后再于生产系统之上进行实施。远程管理的支持 EMC 的 RECOVERPOINT 设备支持远程的管理与维护,可以配置 Email地址,并选择某一类型的信息发送到该地址。同时,经过用户开放许可,在北京的技术服务中心和美国 EMC 公司的服务人员都可以随时提供远程支持。以最快的速度解决问题。便捷的配置恢复 在 RECOVERPOINT 自身发

25、生故障,甚至需要更换时,可以便捷地从原来的配置信息中恢复其配置。该信息被保存在磁盘阵列中,并且该空间只有 EMC软件可以支配,从而保障其安全可靠性。灵活的扩展支持 EMC 的解决方案支持双向的数据复制,支持异构的平台和存储设备,便于扩展。任何应用类型的适应性(方案的通用性)由于 EMC 的独特数据复制方式,决定了该方案可以适应任何的应用类型.这 样 便 为 用 户 提 供 了 灵 活 便 利 的 应 用 扩 展 余 地.可 以 方 便 地 把 今 后 的 应 用 纳入到本书据复制体系中来。综上,我们认为采用 EMC 的数据容灾解决方案是最合适的选择。3。3 灾备中心的组建 根据当前的用户应用环

26、境和今后发展的考虑,我们建议在远程灾备点组建 SAN 的存储架构用于省数据中心和今后其它生产点数据的集中灾备中心.基本的架构如下图示意。11 针对这种架构,我们建议在产品的选择上作如下的基本要求:1)在 经 费 许 可 的 情 况 下 配 置 双 交 换 机,配 置 必 要 的 服 务 器(但 是 对 于RECOVERPOINT 的解决 方案来说,并不需要 在灾备中心配置服务 器,我们建议配置服务器的目的仅在于对数据的验证和某些必要的操作).初期可以配置单台光纤交换机。2)磁盘阵列的选择建议采用 FCSATA 的磁盘。作为数据的灾备系统,日常并不涉及到应用,因此,建议采用价格相对低廉的 FC-

27、SATA 磁盘阵列。3)关键产品配置冗余部件,提高安全性。磁带库可作为备选设备供远期扩容之用。2。4 数据容灾系统的基本结构 基于美国 EMC 公司的产品,我们提供了如下图的数据安全保障体系架构。从下图可以看出,系统的配置简单,结构清晰。在本方案中我们不需要在数据中心的各服务器上安装软件,唯一需要的是在需要做数据复制的系统上安装 RECOVERPOINT 的驱动程序,而不需要在服务器上作任何其他方面的调试。12 该结构的主要配置如下:在数据中心 和 灾备中 心分别配置 两台 RECOVERPOINT,分别 连接到 光纤存储交换机和以太网络,每个点的 RECOVERPOINT 之间可以自动冗余,

28、保障数据容灾系统的不间断运行.在各服务器上只需要安装 RECOVERPOINT 的驱动程序,不需要安装其他的任何软件。具体请参考如下示意图.13 2。5 数据的远程复制流程 EMC 提供了完整的独立于应用系统之外的数据容灾体系.这样对应用系统的影响被降低到最低。具体的数据复制过程如下所述:在需要作数据复制的应用服务器上安装 RECOVERPOINT 的驱动软件.在应用数据进行写操作时,这些驱动程序会截取这些写入操作,并把该写入操作在继续其正常写入的同时并行地复制到本地的 RECOVERPOINT 设备上。数据中心的 RECOVERPOINT 设备在 接收到上 述数据之 后 通过诸如 压缩等方

29、面 的 处 理,根 据 策 略 设 置 把 相 关 数 据 传 递 到 远 程(灾 备 中 心)的RECOVERPOINT 设备上。远程(灾备中心)的 RECOVERPOINT 设备把上述数据按照严格的写入顺序写入到远程(灾备中心)的磁盘存储系统,实现数据的一致性远程保存。另外的一种方式,EMC 安装在本地服务器 上面的驱动在接收到 远程磁盘阵 列 的 写 入 反 馈(ACK)应 答 之 后 才 继 续 进 行 下 一 个 写 入 操 作,这 样 的 方 式 是100同步的方式,可以保障数据 100%的完整和可用性。还有,EMC 的复制支 持某一个时间点的复 制方式,可以每隔几 秒钟自动产生一

30、次快照,并在远程保存这些快照,这样,快照历史库可以便利地恢复历史 库 中 某 一 个 时 间 的 数 据.便 于 在 最 新 数 据 被 破 坏 的 情 况 下,可 用 数 据 的 恢复.上述几种方式的利用可以由 RECOVERPOINT 自动优化选择,无需人工调整或设置。因此,从该方面来讲,EMC 的解决方案不仅仅可以恢复最新的应用数据,同时也可以恢复某一个时间点的数据。基于上述数据复制原理,EMC 适应任何类型的应用数据,同时无需单独购买诸如针对 Oracle、Informix 等等不同应用的选件。这一方面也为用户今后的扩展提供了方便。这 种 数 据 复 制 可 以 基 于 一 定 的 策

31、 略 设 置,针 对 不 同 的 应 用 采 用 不 同 的 诸如延迟、带宽占用等方面的策略设置,确保关键数据的可靠性复制。由于数据在正常写入的同时被传递到本地 RECOVERPOINT 设备上,因此,这种数据丢失的可能性被降低到最低的程度,在某种程度上 EMC 提供了无数居丢失的安全保障.在本地配置两台 RECOVERPOINT 设备,可以保障其中一台故障的情况下,14 保证数据实时复制的继续性,起到冗余的作用.这种切换是自动的,无需人工调整.2.6 数据的远程恢复流程 在本地数据出现故障的情况下,可以通过 RECOVERPOINT 的图形界面方便地把数据恢复过来。完整数据的恢复流程仅仅需要

32、调整原来的数据复制方向,由本地到远程调整为由远程到本地,那末,远程的数据将会作为源数据被复制到本地,从而实现数据的恢复。这种恢复是最新数据并且是最完整的恢复.在 某 些 情 况 下,被 复 制 到 远 程 的 数 据 可 能 因 为 在 复 制 的 同 时 本 地 数 据 已经被破坏等原因导致最新数据不可用的情况.此时,我们完全可以通过可用的最新数据快照恢复可用的数据。由于 EMC 提供了数据快照历史库的原因,我们可以根据需要把数据恢复到原来的某一个时刻,在一定程度上取代利用磁带所作的数据备份的功能。当然这种取代是在一定程度上的,并不能完全代替历史数据的备份。在 某 些 情 况 下 需 要 对

33、 部 分 文 件 进 行 恢 复 时,可 以 把 灾 备 中 心 的 数 据 复 制卷加载上来,随意恢复任何一个文件。4.6 RECOVERPOINT 的管理与维护 RECOVERPOINT 支持基于 WEB 的全局管理,用户可以便利地实现远程监控,并可以通过 email 来定制一定类型的活全部的系统信息,包括故障、警告等,从而在最短的时间内获得系统得异常信息。下面是 RECOVERPOINT 的管理界面示意图:15 从上图可以看到,系统中的 SAN 组件,WAN 及主机均可以动态体现出来,无论是其中的任何一个发生故障,那末,都会在该图形上直接显示,一旦故障解决,系统可以自动恢复,无须人工处理

34、.这位系统整体的管理带来了直观性和便利性.系统的远程维护:RECOVERPOINT 支 持其 远程管理,在用 户许可 并对管理员开放 用户 名和密码后,可以通过互联网络直接登录到 RECOVERPOINT,从而进行一定的分析与处理。4。7 基本的策略设置 系统可以根据应用的不同、安全级别要求的不同、线路的利用要求等多方面进行策略设置,这些策略包括:优先级别的设置,不同的复制组可以设置相对的优先级别,从而保障关键应用数据的不丢失,体现出不同应用数据不同的安全要求。带宽利用率的设置,如果用户的带宽比较紧张,那末可以限制数据复制 16 所占用的带宽,从而,全面保障应用带宽,保障应用性能.高压缩率的设

35、置,系统提供可 610 倍的压缩率,对于数据库应用甚至可以高达 15 倍的压缩,从而为数据的传输性能带来保障.高级策略设置:数 据 复 制 系 统(RECOVERPOINT)故 障 后 是 否 保 持 应 用 系 统 的 继 续 运 行,否则,一旦 RECOVERPOINT 故障,可以在同一时间终止应用系统的写入,从而保 障 应 用 系 统 数 据 和 灾 备 数 据 保 持 完 整 地 一 致.缺 省 情 况 下,RECOVERPOINT的故障对应用系统没有任何影响。在 WAN 故障情况下,是否允许应用系统得继续运行。等等。17 4。8 整体的成本降低 从发展的角度来看,我们推荐的 RECO

36、VERPOINT 方案可以在如下的几个方面为用户带来附加的费用降低,从而带来整体的投资降低:1)对不同磁盘阵列的支持:本地和远程的磁盘阵列可以不同,为今后的扩展带来便利。灾备点的磁盘阵列可以根据情况来选用中端或低端的产品.2)对不同应用类型的支持,避免了今后不同的应用需要需要采用另外的方案来实现容灾的目的。3)低带宽的要求,带来后续带宽成本的降低。4)维护成本大大降低,由于涉及内容较少,和磁盘阵列、SAN、应用等多个方面都没有较大的关系,因此,维护的工作量大大降低,同时远程的维护支持带来了 7*24 维护的可能,代表着整体的维护成本的降低。5)后续扩展的成本,KBX 支持多对一的复制,也支持双

37、向的复制,因此,对于今后的节点加入和扩展带来了保障,无须另外的方案解决.2。7 本容灾系统的结构特点 从上面的配置介绍及示意图,我们可以清楚看到本子系统的主要特点:充分降低数据安全体系对系统的影响;真正实时的数据远程复制;数据的完整恢复(零数据丢失)保障;和应用无关;支持任何应用类型;实施维护便利;扩展便利;距离无限制,服务器增加或应用增加不需要重新购买相关软件;支持异构服务器和存储环境(不同厂家的磁盘阵列);100的数据一致性恢复,确保数据的可用性。自身具备高可用支持,保障了容灾自身体系的不间段运行.对 现 有 的 存 储 系 统 及 应 用 系 统 无 须 调 整,确 保 当 前 应 用

38、系 统 的 稳 定性。18 持续的数据保护,可以把数据恢复到任意的时间点.2.8 数据容灾系统扩展 可以从三个方面来讨论本问题:1)应用类型的扩展,不可避免地会存在多种类型数据(应用)的远程复制(容灾)要求,这样,就要求当前的容灾设计必须要适用这种多种类型数据共存的需求.我们提供的解决方案和应用类型没有任何关系,因此,无论是何种应用类型产生的数据或任何的数据类型都能够被本容灾系统复制到远程。2)应 用 服 务 器 的 扩 展,我 们 提 供 的 方 案 支 持 异 构 的 平 台 和 磁 盘 阵 列,因此,面向未来的发展,无论是服务器的增加还是其他厂家(或型号)的磁盘阵列的加入,都可以被轻松地

39、纳入到本容灾体系中.还有我们提供的方案在造价上和应用服务器的数量和类型没有关系,便于随时扩展服务器。3)基于应用级容灾需求的扩展。由于我们提供的方案保障了远程数据的可用性,因此,可以便利地利用其他高可用软件来实现应用的远程切换.4)今后其他点的加入:如果有其他地点的数据需要作容灾规划,那末,只需要和本配置一样配置相应的 RECOVERPOINT 硬件产品即可。其他完全可以利用本灾备中心的所有资源。因此,这种扩展将极为便利,无须再添加其他的相关产品/设备。对当前整个的灾备系统业没有任何影响。2.9 系统投资保障 由于 EMC 的 RECOVERPOINT 产品和应用类型无关,支持异构的平台和存储

40、设备,因此,可以充分利用现有的系统环境,充分保障用户现有的投资。同时上面对扩展性的灵活支持也是对用户当前投资的一种充分保障.3.数据容灾系统与其他方案的简要比较 当前,还有一些厂商提供了基于磁盘阵列的数据复制解决方案。主要包括 EMC、IBM 等厂家。其主要结构是在本地数据中心和灾备中心均配置同一厂家的磁盘阵列产品,中间通过光纤通道连接,以逻辑卷为基本单位,将本地磁盘阵列上的数据同步镜像到远程的磁盘阵列上.19 一 般 这 样 的 方 案 可 以 工 作 在 同 步 和 异 步 两 种 模 式 下,同 步 要 求 带 宽 要 足够宽,异步则存在可能的数据丢失或对本地应用产生影响.一般这些方案都

41、不支持自动得快照功能,另外,快照也不是基于增量的,占用较大空间的同时,对应用等都将产生一定得影响。从而在最新数据不能够利用的情况下,数据的可用性恢复和数据的丢失量无法保障。就 此,我 们 作 如 下 的 简 要 比 较 列 表 供 大 家 参 考:序 功 能 EMC RECOVERPOINT 基 于 磁 盘 阵 列 的方 案 备 注 1 实 时 性 实 时 准 实 时 2 通 用 性 和 磁 盘 阵 列 无 关 只 能 适 用 于 同 一个 厂 家 的 磁 盘 阵列 产 品 3 远 程 数据 处 理(正 常 复制 过 程中)远 程 数据 可 用性 支 持 读 写,对 生 产 应 用无 任 何

42、影 响,不 支 持 读,不 支持 写 入 操 作。远 程 数据 处 理对 复 制的 影 响 不 影 响 不 支 持 数 据 操 作(处 理),如 果 需要 进 行 处 理,那末,必 须 中 断 复制 过 程。远 程 数据 的 写操 作 及数 据 重置 支 持,并 支 持 数 据 重 置(Reset),保 持 灾 备 数据 始 终 保 持 与 本 地 数据 的 一 致 性。不 支 持,如 果 远程 数 据 被 更 改,那 末,没 有 办 法恢 复 本 地 和 远 程数 据 的 一 致 性。4 数 据 的可 用 性 最 新 生产 数 可用 时 始 终 可 用 可 用 20 5 最 新 生产 数 据

43、不 可 用时 可 以 通 过 回 滚,来 恢 复如 15 秒 或 30 秒 或 几 分钟 之 前 的 数 据,在 保 证恢 复 可 用 数 据 的 同 时,也 保 障 数 据 的 丢 失 量最 小 必 须 结 合 利 用 其他 工 具 进 行 快 照处 理,但 是,快 照的 频 率 较 小,数据 可 能 的 丢 失 率较 大。部 支 持 自 动 的 快照 产 生。后 者(基 于盘 阵 的 解 决方 案)的 快照 对 应 用 具有 很 大 的 影响,因 为 产生 快 照 的 时候,需 要 暂停 应 用.6 快 照 增 量、自 动 非 增 量、需 要 脚本 实 现 自 动 化 7 占 用 空 间

44、较 小 较 大 快 照 需 要 的附 加 空 间 8 带 宽 一 般,无 需 专 线 很 高,必 须 专 线,一 般 为 光 纤 专线.9 技 术 复 杂 度 极 其 简 单,支持 WEB、GUI、CLI 方 式 的 集 中管 理.较 复 杂,两 套 软件 分 别 管 理 10 后 期 演练 难 度 简 单 复 杂 快 照 数据 的 利用 直 接 利 用 间 接 利 用 11 成 本 较 低 较 高 整 体 的 购 买成 本 及 维 护成 本.12 自 身 高 可 用 支 持 不 支 持 13 高 度 压 缩 6-10 倍 无 14 对 应 用 系 统 的 影 响 无 影 响 自 身 故 障,

45、对 应用 系 统 有 影 响 15 策 略 化 支 持 不 支 持 4。数据容灾系统的实施计划 4。1 系统实施需求规划 初步建议用户在每个点采用单台 RECOVERPOINT 设备,今后可以扩展到两 21 台,达到冗余的目的.在此情况下我们作如下的基本规划:在灾备中心的磁盘阵 列上分别划分出多个 不同的LUN,分别供 复制时接收不同的应用类型数据使用.在本地和和灾备中心的磁盘阵列上再分别划分出 2 个 LUN,分别作为 EMC Volume 和 Snapshot History Volume.前者用来保存 RECOVERPOINT 的所有配置信息,以及 RECOVERPOINT 相关的集群状

46、态数据,空间要求为 10GB 左右即可.后 者,用 来 保 存 快 照 记 录,用 于 在 最 新 数 据 不 可 用 的 情 况 下,通 过 回 滚 来 恢 复可用数据,并保持最小化的数据丢失量。该卷的空间大小根据用户说明,需要考虑长达 24 小时的数据复制中断情况下的数据变化量来综合考虑。在 本 地 和 灾 备 中 心 的 光 纤 交 换 机 上 分 别 配 置 两 个 光 纤 口,连 接RECOVERPOINT。在 本 地 和 灾 备 中 心 的 以 太 网 络 交 换 机 上 分 别 配 置 两 个 口,分 别 连 接RECOVERPOINT,其中 每 台 RECOVERPOINT 具

47、 有两个 以太网 口,一个 连接内 部局域网,另一个连接 WAN.进行简单的图形 化配 置 RECOVERPOINT,完 成数据的初始化,进入 正常数据复制.进行相关测试,验收。进入后续维护期.4.2 相关性要求/实施步骤 在系统的实施过程中,需要诸如磁盘阵列厂家、光纤交换机厂家及用户或应用软件开发商提供简单的协助,具体的任务计划如下.(注:黄色部分均为实施前的准备工作,真正的 RECOVERPOINT 的实施步骤为下表中的 7-13。整体的实施周期为一周,包括实施及验收、测试。)序号 项目/任务内容 负责方 完成时间 备注 1 确认 24 小时的数据最大变化量 软 件 开 发 商和用户 2

48、磁 盘 阵 列(数 据 中 心和 灾 备 中心)创建LUN,用于接 收 被 复制的数据.磁 盘 阵 列 厂商/维护人员 半天 和 生 产 用 空 间 相同.22 创 建EMC Volume 20GB10GB 创建Snapshot History Volume =24 小时的最大数据变化量。3 光 纤 交 换 机 的 Zoning设置 光 纤 交 换 机厂 商&灾 备系统实施方 需要把EMC Volume和Snapshot Volume及应用 LUN 进行安全设置.4 连接RECOVERPOINT,数据中 心 和 灾 备 中 心 同 时进行 软 件 开 发 商 灾 备 系 统实施方 半天 5 配

49、置 RECOVERPOINT,安 装 服 务 器 端 的RECOVERPOINT 驱 动程序 需要确认RECOVERPOINT利 用 的IP和Gateway 地址,数据 中 心 和 灾 备 中心的 KBX 各需要5 个 IP 地址。6 申请重新引导系统 系 统 管 理 员/主 机 厂 商/软件开发商 需要提前申请 7 现有数据系统初始化 软 件 开 发 商&灾 备 系 统实施方 一天 初 始 化 最 好 在 应用 停 止 的 情 况 下进 行,当 然 也 支持 在 线 的 数 据 初始化.8 系统初始化验证 软 件 开 发 商&灾 备 系 统实施方 23 9 数 据 的 持 续 性 实 时 复

50、制,代表灾备系统正常运行 软 件 开 发 商 灾 备 系 统实施方 一天/二天 10 数据的验证测试 11 灾 备 数 据 的 可 用 性 测试 12 灾备系统的回切(从 灾备 中 心 到 数 据 中 心)的测试 根 据 需 要 决 定 是否进行本项测试 13 进入系统正常运行、维护期 转交给用户进行日常管理.需要定期的演练 4。3 系统配置清单 针对上书分析,我们作如下的配置清单列 表:序号 产品名称 分布 作用 备注 1 RECOVERPOINT硬件设备 生 产 中心 和 灾备 中 心各一.发送/接收数据 远 期 可 以 扩 展 到各 两 台,达 到 冗余目的。2 EMC 数 据 复 制软

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com