评析双活容灾解决方案(转)

2016-01-14

  随着信息技术的发展,包括新技术云计算、大数据的快速发展,越来越多的企业把应用、数据、系统进行集中处理,数据大集中的同时也面临风险,灾难性的突发事件发生时如何保障企业核心业务的在线性,即核心业务7*24小时的业不间断运行,成为企业关注的首要问题。
  突发事件造成的非计划宕机的事件不可避免,尤其是企业集中化管理的数据中心,数据中心采用的保护手段及企业所处行业的性质等不同的因素,使得在突发事件发生后恢复业力所花的时间及受损的隐性成本也各不相同,如下图是Business Continuity QuickPoll的大数据分析结果,对各种行业及突发事件发生后所花的时间进行详细分析得出的结论。



虽然各个企业现都已采用的数据保护的手段及方法,目的都是积极在保障业务的在线性及数据不丢失,但是,传统数据中心采用较为广泛的容灾建设模式中,或多或少还存在一些不足之处,如面临资源利用率低、切换时间长业务、突发事件中存在必然的数据损失、数据中心运维整体健康状态不可见、缺少演练等的挑战。
  “当一个站点发生故障时,另外一个站点可实时接管所有业务”的双活解决方案成为当前讨论和建设的热门话题,双活容灾解决方案能够盘活现有IT资源,充分发挥资源利用优势,实现应用级双活无感知切换,达到企业对外业务服务的7x24小时服务质量保证,降低灾难性事件发生后业务宕机的风险。

现有双活容灾解决方案

 

    1.应用层双活方案---典型是针对Oracle核心数据库而建设的方案,通过对数据库基于redo复原或SQL语句再执行来完成。九桥FZS,quest,goldengate。

    2.主机层双活方案---主要是针对X86架构的解决方案,能够很多的支持widnows操作系统,因linux的kernel的不确定性,对其支持非常有限,当然也有针对UNIX AIX的解决方案,如IBM的HyperSwap方案,Symentac的VVR方案推出多年,应用也相对较多,但在实际应用中问题多多,渐渐已被用户放弃。

    3.存储虚拟化层双活方案---存储虚拟化层的双活方案如雨后春笋,因技术、维护、建设等的优势,发展相当快速,如IBM SVC, 华为VIS6000、宏杉、怡敏信等,目前是业界应用最为广泛的双活解决方案。通过存储虚拟化层实现数据同步,支持的应用也较为广泛,包括Oracle RAC, 虚拟化平台vmware及传统集群系统等。

    4.存储层双活方案---存储层双活方案其实是存储虚拟化层双活方案的简化版,不可以虚拟化第三方存储的经济型解决方案。

 

双活容灾解决方案建设要点

1.网络接入的全局负载均衡

   无论双活方案怎么建设,首先要确保客户端能够访问到业务系统,因此在双活容灾解决方案中,企业用户在网络层做到网络接入的全局负载均衡,确保数据中心的切换过程中的网络接入的无缝切换。这样才能保证整体业务服务的不间断运行,达到终极的双活容灾方案的实施效果。
     2.业务会话的同步机制
   目前业务会话的同步机制必须依赖于Oracle RAC、虚拟化主机平台vmware的vmotion、传统的集群系统或第三方业务会话管理系统等的支持,才能有效的保证业务会话的同步机制,尤其是传统的集群系统必须支持远距离的心跳监测。防止资源争用、业务I/O冲突、均衡请求接入。达到业务层的监测、切换接管。
    3.跨中心的数据同步机制
双活容灾解决方案跨跃两个数据中心,无论采用应用层、主机层还是存储虚拟化层,都必须达到数据双写的功能。使得两个中心的业务数据实时一致。才能有效的保证数据不丢失及快速“零”切换。
    4.运营一体化管理
   双活数据中心是对等的两个业务生产中心,企业对数据中心维护人员的建设及双活解决方案提供者的技术支援在双活容灾解决文案建设中不容忽视,企业必须将两个数据中心纳入一体化的运营管理,包括人员、流程、操作规范等,在技术传递上,也需提升双活数据中心的维护技能。同时也对双活容灾解决方案提供商的售后服务和响应有一定的要求。
     5.现有业务的改造及支持
   不是现有所有业务系统都支持双活容灾方案的,企业用户的业务系统因建设时间,要求等的不同,存在多种多样,要想建设好双活数据中心。需要将不支持双活数据中心的业务系统进行改造,如迁移到虚拟化主机平台或者构建冗余的集群系统等,在改造建设中可能会存在一定的风险,需企业用户容忍新的风险,做好规避风险的措施及补救方案。     


本网站由阿里云提供云计算及安全服务 Powered by CloudDream