某股份制商业银行数据中心灾备建设经验

数据中心运维管理

共 1941字,需浏览 4分钟

 · 2021-10-17

一、灾备定义与演进


灾备是指组织的灾难备援。在信息化的IT系统中,灾备是指在灾难未发生前,利用 IT 技术对信息系统的数据和应用程序进行保护,包括本地及异地的数据备份、应用和场所的接管等,确保系统遭受灾难时数据的安全,以及业务的快速恢复,为企业的正常运行供服务。灾备起源于上世纪 70 年代的美国。1979 年,IT 公司 SunGard 在美国费城建立了全世界第一个灾备中心。当时人们关注的重点是企业 IT系统的数据备份和系统备份等。随后 IT 备份发展到了灾难恢复规划(DRP),并在 IT 备份中加入了灾难恢复预案、资源需求和灾备中心的管理,形成了对生产运行中心的保障概念。


此后,人们进行灾难恢复规划时,将保护IT系统的灾备范畴拓展到 IT 所支 持的业务领域,并根据保护业务的要求衡量灾备的目标——哪些业务最重要?哪些业务需要最先恢复?


美国“9·11 恐怖袭击事件”后,全球用户升了对灾备的重视程度,异地灾备建设一时成为趋势,并且从全面风险管控的角度出发,以及IT技术的不断更新,灾备的范畴从传统的数据和系统备份、 恢复,业务连续性规划、灾难恢复规划、灾备演练、灾备从业资质认证、人才培养、法律法规制定等方面,拓展到了通信保障、危机公关、紧急事件 响应、第三方合作机构和供应链危机管理等。


二、某行灾备架构设计


1.存储建设概况


我行生产类业务系统均部署于全冗余架构的共享存储中,存储平台使用阵列双活架构,两台高端存储同时通过FC SAN网络向上层主机集群提供业务访问,两台存储之间进行实时数据同步。当出现设备、链路等因素导致其中一台存储不可被访问,存储底层进行故障切换而不会停止数据读写,主机上层对底层的故障切换无感知,业务不中断,真正做到了RTO和RPO都为零的本地高可靠容灾。


2.数据级备份系统建设情况


我行哈密主机房和乌鲁木齐机房各部署一套备份一体机,同时管理后端物理带库或其他备份介质数据备份采用D-D-T的介质存储策略,数据优先备份到备份一体机,数据消重后,定期自动化转储到带库并进行自动出库,提高数据的安全性。满足数据快速备份和恢复的要求。对VMWARE虚拟化、oralce数据库进行SANClient备份,主机系统进行LAN备份。备份系统灵活、扩展性强;管理简单,自动化运行,减少人为干预;对“结构化”和“非结构化”数据进行重复数据删除;对各系统的不同类别保护对象进行全方位保护,如:虚拟化、应用程序、配置、数据库、操作系统等;将存储的的快照和复制功能纳入到管理平台进行统一管理,备份软件的RD功能进行应用感知,可以和存储的管理软件集成,无缝支持存储的快照等功能,直接进行快照调用和管理。并且通过快照就可以直接实现细粒度的备份和恢复(比如虚拟机的单文件,数据库单个表空间等),并保证一致性。整个过程都在备份软件界面实现,无需管理员配合。对备份数据进行有效的效验和恢复测试,保证备份的有效性。



3.应用级备份系统建设情况


我行已经建立了容灾管理平台,通过字节级数据复制技术,将数据持续不断地复制到本地或者任意距离的异地灾备中心,实现数据的持续保护。



三、实践总结


信息安全是国家安全的重要组成部分,已经上升到与政治安全、经济安全、领土安全等并驾齐驱的战略高度。《中华人民共和国国民经济和社会发展第十三个五年规划纲要》中明确指出要:强化信息安全保障,包括强化重要信息系统和数据资源保护,加强数据资源在采集、存储、应用和开放等环节的安全保护,加强各类公共数据资源在公开共享等环节的安全评估与保护等。而对于信息安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转。



资料免费送(点击链接下载)

史上最全,数据中心机房标准及规范汇总(下载)

数据中心运维管理 | 资料汇总(2017.7.2版本)                                                    

加入运维管理VIP群(点击链接查看)

《数据中心运维管理》VIP技术交流群会员招募说明


扫描以下二维码加入学习群

浏览 14
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报