浅析核电信息化数据的容灾备份

和力记易 发表于:13年03月19日 11:27 [来稿] 存储在线

  • 分享:
[导读]本文阐述了在信息化日益发展的同时,核电领域如何做好信息化数据的容灾备份工作,用以防止数据的丢失、破坏以及业务的中断。

一、引言

随着计算能力以及存储技术的日新月异,各种TB级的存储被越来越广泛的使用,这无疑在宣告一个事实:大数据时代已经完全进入到我们的生活。作为核电领域来说,是更早步入大数据时代的领先者。其数据的主要构成除了结构化的各种数据库,还有大量电子文档、图像、视频等非结构化数据。这些数据具有增长速度快、利用率高、安全等级高等特点。如何有效的对这些数据进行容灾备份,确保这些数据不会丢失,提供这些数据的业务不会中断,是核电领域必须考虑的一个问题,这直接关系到了整个核电领域是否能够正常运转。

二、核电信息化数据的特点

相较其它行业来说,核电领域的信息化数据具有自身的特点,主要体现在以下几个方面:

1、数据结构混杂

数据的存在格式一般分为结构化数据和非结构数据,而核电的数据基本上是非结构化存在结构化加工。所谓非结构化存在是指的数据主要以电子文档、设计/工程图纸、实物、照片、影像/声音等各种各样的人文与科学数据为主,而所谓的结构化加工是指的为了方便对非结构数据进行管理和利用,将按照国家核行业标准《核电电子文件元数据》的规定录入结构化数据库中。这就使得核电领域数据的格式复杂多样,结构化数据和非结构化数据混杂。

2、数据要求保存周期长

按照《核电文件档案管理要求》的附录“核电文件归档范围和保管期限”中所提到的保管期限来看,基本上所有的文件都要求至少长期保存,其中一大部分还要求永久保存。

3、数据要求具有抗破坏性

《核电文件档案管理要求》的7.4.5.3中还明确提到“数据备份应该考虑到自然灾害、人为破坏和其它意外情况等因素,采取可靠的备份措施,例如不同媒体的异地备份”。自然灾害很好理解,指的是水、火以及地震等灾难;所谓的人为破坏就是软破坏,主要是指的人为所造成的数据破坏,如对数据进行有意或者无意的修改、删除等操作;其它意外情况范围较广,但也最容易发生,如计划内或者计划外的重启所引起的磁盘电流冲击而导致的数据缺失等。

三、核电信息化数据的容灾备份现状

核电领域对数据的备份一直很重视,但由于选择的产品和备份技术不同,主要存在以下几个问题:

1、数据备份的实时性不强

大部分核电单位对数据采用了全备、增量、差异的备份方式,建立起了备份的作业。这就使得数据的备份行为按照作业的计划执行,备份作业在什么时候开始,数据就在什么时候备份。这就意味着备份的行为是存在着明显的备份时间窗口的,而这种备份时间窗口将会直接导致数据的丢失。假设每周日做全备而周一到周六每天的下午6点做增量备份(如图1),那么如果在周三的5点59分数据出现问题的话,此时最近的恢复点是周二6点的恢复点,这就意味着将要丢失近24小时的数据。

 


 

图1

2、业务连续性不强

数据的作用是提供给应用进行处理和展现,所以数据的好坏将直接决定了应用是否正常。对于传统的全备、增量、差异等备份方式来说,想使用备份数据的时候必须经历一个数据恢复的过程。同样以周日做全备,周一到周六的每天下午6点做增量备份为例。如果当前的时间是周六的上午,源数据的存储介质损坏,导致源数据丢失,此时在修复存储介质后要首先恢复上周日的全备份,然后依次恢复周一到周五的增量,我们且不说周五下午6点到周六上午的数据不能被恢复。就是周一到周五能恢复的数据也要花费大量的时间成本,在此期间应用无法获得正常数据的支撑,业务将会陷入瘫痪状态。

3、不具备防破坏能力。

对于数据的破坏,我们在前面分成了自然破坏、软破坏以及意外破坏。对于自然破坏来说一般采用异地备份的方式,但是对于软破坏以及意外破坏传统的备份方式却很难解决。我们还是以周日做全备,周一到周六的每天下午6点做增量备份为例。假设当前时间是在周五的,上午8点到下午4点期间往数据库中录入了2万条索引记录,而在4点01分,这些数据因为一条SQL语句写错被误删除。那么此时离当前时间最近的是周四下午6点的恢复点,那时候是还没有这2万条数据的。这就意味着被误删的2万条数据将永久丢失。

而对于意外情况,如重启所造成的数据缺失而导致数据库置疑以及无法加载时,也只能恢复到上一个恢复点,而这个恢复点距离故障点有很大的时间窗口,这就导致了破坏无法被完全修复。

四、核电信息化数据可靠灾备的建设目标

综合核电领域信息化数据的特点,在进行容灾备份时,需要重点实现以下建设目标:

1、各服务器上重要数据零丢失

对数据进行自动监控,连续捕获和备份数据变化,只要数据发生变化,便实时、准确的备份下来。保证了数据的安全,一旦出现数据丢失或破坏,可以迅速的从备份机上把数据恢复回来。

2、灾难发生后进行迅速接管和逆向同步

当主服务器出现意外宕机时,备份机可以在一分钟之内接管主服务器的IP,提供对外的所有服务,保证了核心业务连续性,可以提供365天7*24小时的业务不间断的保护。

灾难发生后,原有系统必须尽快恢复。恢复时执行与数据容灾复制相反的过程,即从灾备中心逆向同步到主数据中心,同步完成即可做应用切换,整个系统恢复到原有状态。

3、数据可进行任意时间数据恢复

可按任意操作步数或时间点进行数据快速恢复,回到数据库的任何状态,从而能够找回误删或者损坏前的数据。在恢复的过程中不但保证了数据的完整型,而且能保证事件的完整性。解决了数据逻辑错误。

4、数据的异地容灾

响应《核电文件档案管理要求》,对重要数据进行异地容灾,异地的容灾场地和生产中心需要不在同一个电网、不在同一个江河流域、不在同一个地震带,相隔300公里以上。

[责任编辑:黄辉]
大黄
以备份起家的CommVault近两年的解决方案不断向更全面的数据保护转型,并对数据管理、数据挖掘也有了一些关注。CommVault中国区技术总监蔡报永接受采访时表示CommVault将继续做一家专注做数据管理和信息管理的软件厂商。
官方微信
weixin
精彩专题更多
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
12月15日,中国闪存联盟成立,同时IBM Flash System卓越中心正式启动
DOIT、DOSTOR、易会移动客户端播报中国存储峰会盛况。
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.