关于云计算的讨论在持续升温,越来越多的以运营商为代表的企业开始对云计算进行研究和部署。然而,在云存储环境中存在着大量的异构环境,而传统容灾技术以同构存储为主,无法在异构环境中实现容灾保护。中国移动安徽公司(以下简称安徽移动)就对云存储环境下的异构存储容灾进行了探索。
建设独立、开放的容灾系统
容灾系统的独立性和开放性,对于安徽移动现在以及将来保持系统平台和存储平台的灵活性都至关重要。一个好的容灾系统不仅能够满足企业目前的容灾需要,而且还能够为将来的数据平台选择提供更大的灵活性。
容灾系统的独立性、开放性表现在以下几方面:可以支持用户现有的服务器平台以及将来可能选择的主流服务器平台,可以支持用户现有的存储平台以及将来可能选择的主流存储平台。对于安徽移动而言,各业务系统的核心数据涉及多种主要的存储平台,这就要求容灾方案能够全面支持用户现有的以及将来可能采用的各种存储平台。
赛门铁克公司提供的容灾解决方案,能够全面支持主流的服务器和存储平台,特别是存储平台,赛门铁克的容灾解决方案可以帮助用户实现存储平台的无关性,这为用户将来部署新系统提供了更大的选择空间。
用户系统环境现状
安徽移动从BOSS 3.0上线开始,就利用云存储技术对原有的存储系统进行了改造,通过虚拟化技术、云计算技术实现异构环境下的统一管理,使应用逐步摆脱对硬件基础架构的依赖。在原有的Sun主机、EMC存储的基础上,安徽移动逐步引入其他品牌的主机和存储设备(包括惠普、IBM、富士通的主机,惠普、Sun、HDS等品牌的存储产品),从而有效降低了硬件的采购成本。
安徽移动使用的存储虚拟化技术是通过部署在主机上的Symantec Storage Foundation软件,经过虚拟化的存储空间,可以跨越多个异构的磁盘阵列。这种虚拟化功能通常由主机操作系统下的逻辑卷管理软件来实现,其最大优点是稳定、开放,并可实现在线管理。Storage Foundation的核心包含一个卷管理器(VxVM)和其上的文件系统(VxFS)。
VxVM增强了对磁盘驱动器和LUN的管理。独立的多路径软件(DMP)能够屏蔽不同存储设备间的差异,从而确保数据能在异构存储间在线移动。VxVM统一了不同主机环境下卷的组织格式,确保数据能够在不同主机系统间灵活迁移。
远距离跨磁盘阵列镜像
安徽移动原有的容灾系统采用传统硬件复制技术,对硬件平台有很强的依赖性,生产站点和容灾站点必须使用相同品牌的存储设备。改用存储虚拟化方案后,安徽移动的容灾系统突破了硬件的限制。
利用Storage Foundation软件和SAN网络的远距离连接能力,安徽移动可以实现生产中心与容灾中心之间远距离的跨磁盘阵列的镜像,从而提高数据系统的可靠性。
当生产中心的磁盘系统发生故障或灾难时,由于同城容灾中心的磁盘是生产中心磁盘系统的镜像,操作系统会自动隔离生产中心的磁盘,转而对容灾中心的数据进行访问。业务系统可以通过城域SAN网络直接访问灾备中心磁盘系统中的数据,而不会影响生产中心的业务系统。也就是说,生产中心磁盘系统的灾难对业务系统是透明的,应用和数据库不会因为生产中心磁盘系统的故障而停止。更重要的是,应用和数据库不会因为灾难而中止,从而避免了发生数据损坏的可能性。
生产中心磁盘系统出现故障后,用户只要更换损坏的磁盘系统,然后利用Volume Manager重新生成镜像即可。重新生成镜像的过程,实际上就是将数据从灾备中心的磁盘系统中复制到生产中心磁盘系统中的过程。值得注意的是,整个容灾过程对应用是完全透明的,不需要也不会中断业务系统的正常运行。这是采用基于磁盘系统的复制技术构建的容灾系统所无法实现的。
利用传统磁盘系统复制技术构建容灾系统需要付出额外的代价,主要包括以下几方面:生产磁盘系统出现故障时,会造成应用系统宕机;生产磁盘系统出现故障时,数据系统切换到灾备系统需要较长时间;生产磁盘系统出现故障时,磁盘系统的切换过程很复杂,需要专家支持;需要支付额外的费用。
Storage Foundation软件不仅可以利用镜像实现远程数据容灾,而且具有镜像断裂后的快速同步功能。在需要远程连接的物理环境中,远程链路相对本地连接更容易受损,也更容易引起镜像断裂,因此镜像断裂后的快速同步功能就显得非常重要。Storage Foundation软件可以提供Fast Mirror Resync功能,方便实现增量数据的快速同步。
集群软件异地切换
在上述容灾方案中,生产数据通过SAN环境中的跨阵列镜像功能得到了很好的保护。在生产端服务器上部署集群软件,在本地进行切换,保障了应用的连续性。不过这样的容灾方案还不够完善,当生产机房出现灾害时,用户又应如何保障整个业务的连续性?
用户需要在容灾端部署服务器,并在安装和生产端同样部署存储管理软件及集群软件。在生产端发生灾害时,上述方案不仅能够保护生产端的数据,而且能将生产端的应用切换到容灾端,使用户能够持续访问应用,保障业务的连续性,这也是传统硬件容灾方案所无法实现的。
容灾系统应用效果显著
安徽移动在BOSS 3.0上线时就对容灾系统进行了改进,不仅实施了同构环境下的镜像容灾,而且在结算数据库和BI数据库中进行了异构存储容灾的探索。生产中心采用的存储设备为HP XP,容灾中心采用EMC存储。新的容灾系统上线运行后,完全能够满足应用的需求。
在BOSS的核心系统中,安徽移动也使用了异构容灾方案。在重要性仅次于CRM的中心资源库中,原本计划生产端和容灾端都使用Sun主机加EMC存储的方案。在系统上线前两周,CRM系统要求紧急扩容,但是现有的存储设备容量不足。因此,安徽移动迅速将系统迁移至Sun主机+惠普存储(生产)+Sun存储(容灾)的平台,并使用基于Storage Foundation的镜像容灾和快照技术,将存储资源池化,既提高了资源的利用率,又避免了硬件的锁定。
与此同时,安徽移动新上线的容灾系统,除了能实现容灾功能以外,还能提供如下三种功能。
跨存储的快照
安徽移动原来使用的快照技术只适用于同构存储环境。在使用Storage Foundation后,快照技术不受存储硬件的限制,能以卷为单位进行数据快照和复制,比以LUN为单位的复制更加灵活,性能也丝毫不逊色。
异构存储数据的在线迁移
跨异构阵列的镜像,可以在线迁移生产数据,从而避免应用中止。
实现存储集中统一管理
以往的存储管理、集群管理都是以主机为出发点,无法兼顾整个数据的存储、容灾及集群的使用情况。在使用Storage Foundation后,安徽移动可以通过一个管理平台VOM,了解异构环境中存储设备的使用情况以及容灾状态。统一存储管理平台的使用改变了安徽移动的运维习惯,有效提高了运维的效率。
Storage Foundation降低容灾投资
总而言之,Storage Foundation容灾方案给企业用户带来了很多价值。基于Storage Foundation的容灾方案减少了用户对硬件环境的依赖,从而有效降低了容灾的投资。如果采用传统的硬件容灾方案,生产中心与容灾中心的存储设备必须完全相同。如果采用赛门铁克的存储管理软件,可以彻底改变这种状况。赛门铁克存储管理软件支持异构环境,不仅为用户提供了选择硬件设备的灵活性,而且降低了用户的投资。
如果采用传统硬件容灾方案,用户必须单独购买复制软件;如果采用基于Storage Foundation的容灾方案,用户不必再单独购买复制软件。大多数主机存储管理软件,在回收存储空间或进行条带化处理时,通常会造成应用中断。
赛门铁克存储管理软件具有强大的在线操作功能,保障了业务的连续性。基于Storage Foundation的容灾方案具有强大的在线管理功能,可以减少计划内停机时间。
如果采用基于Storage Foundation的容灾方案,用户不必再单独购买硬件厂商提供的动态多路径软件。赛门铁克存储管理软件内嵌免费的DMP动态多路径管理功能,可以支持不同厂商的存储设备,从而避免在同一主机上安装多种动态多路径软件时可能引起的冲突。
基于Storage Foundation的容灾方案不仅可以实现数据级容灾,而且支持应用级容灾。采用传统的硬件容灾方案,需要人工进行切换,因此会造成应用的中断。