网络独家

从数据事故恢复在几分钟内
杰夫·艾略特

许多严重依赖网络数据进行业务操作、与客户互动、处理付款或为非现场员工提供远程访问的企业认为,由于他们有一个备份和恢复系统,他们可以保护自己免受数据丢失或网络故障的影响。

不幸的是,这种错误的安全感可能会使公司容易受到长期的、潜在的严重业务中断的影响。如此之多,以至于许多企业每年都会经历重大的收入损失和客户信心的下降,甚至倒闭——尽管他们有某种类型的备份系统。

网络备份与恢复的漏洞
“我有一个备份系统,所以我有保障”的心态忽略了几个关键因素。

首先,如果与硬件故障相关,从备份中恢复数据可能需要数小时甚至数天的时间。在IT中,备份也可能损坏,并且在调用时可能不可靠,这是众所周知的事实。其次,除了数据的关键性质之外,应用程序、数据库或电子邮件服务器的故障可能导致业务无法访问这些数据、下订单或给客户结账。

因此,对于严重依赖电子记录或交易的公司(如医疗保健提供商和医疗实践)来说,任何不能在几分钟内将网络恢复到完整功能的解决方案(无论故障原因或故障点是什么)都是不可能的。

“在医疗保健领域,访问数据的能力是极其重要的,”南卡罗来纳州一家独立的多专业医疗机构CMA Healthcare的IT经理贾斯汀·赫卡比(Justin Huckaby)说。“医生现在依靠电子病历为病人做出良好的医疗保健决定。

“在极端情况下,这实际上是一个生死攸关的情况,因为医生根据他们能获得的信息做出决定,”他补充说。

用外行的话来说,业务连续性
发生重大网络事件的几率比大多数企业主意识到的要高得多。IT行业现在回避“灾难”恢复这个术语,因为它意味着罕见的事件,如火灾或其他自然灾害。

但是,数据损坏或丢失的原因有多种,包括服务器和硬盘硬件故障、用户错误、恶意软件、文件共享、远程访问时连接不良等问题。

因此,数据备份和恢复已经演变成IT行业现在所说的“业务连续性”。这个术语有意强调了这样一个事实,即许多业务严重依赖数据,无法承受中断或对数据的访问被限制超过最短的一段时间——无论原因是什么。

业务连续性的核心有两个基本方面。

第一种:备份包括将网络数据复制到磁带、网络附加存储、本地硬件设备或云。市场上有许多廉价的解决方案,而且今天大多数公司都有某种形式的备份系统。

另一方面是在发生数据丢失、损坏或服务器故障时快速恢复信息。对于许多企业来说,这方面是系统中的盲点,使他们容易受到长时间停机的影响。

现实情况是,在检索存储的信息时可能会出现许多困难。

例如,从磁带或云中检索tb级的数据可能需要数小时,甚至数天,这取决于下载速度。如果数据丢失的原因与硬件有关,则需要对系统进行修复或更换后才能进行恢复。根据问题的严重程度,对于无法承受离线几分钟的企业来说,这可能会将停机时间延长到几天。

根据IT专家的说法,另一个问题是存在备份并不意味着数据是原始的。事实上,备份数据和网络数据一样容易损坏。

全面的业务连续性解决方案
一个完整的业务连续性解决方案是什么样的?以下五个因素,综合起来,将发现一个全面的业务连续性解决方案:

1.关键系统的映像备份。一些基本的备份系统将选定的文件复制到磁带或其他网络存储设备上。这允许有限的数据检索,其中一些可能被排除在外,并且备份和恢复数据的过程(在需要时)通常非常缓慢。

当赫卡比第一次被雇佣时,公司依赖于磁带备份,这种备份既耗时又难以管理,而且容易损坏。尽管他为更好的解决方案进行了游说,但直到2010年存储电子病历的服务器出现重大硬件故障后,他才说服所有者做出改变。该事件使系统离线了三到四天。

赫卡比说,从那时起,CMA Healthcare就将其数据备份和恢复委托给统一网络集团有限公司该公司提供了一个业务连续性解决方案,旨在在几分钟内恢复关键系统和数据,无论原因或故障点是什么。

UNG提供更高级的基于映像的备份,创建操作系统及其相关的所有数据的副本,包括系统状态和应用程序配置。备份保存为称为映像的单个文件。

这种方法的优点是可以在几分钟内恢复选定的文件,或者,如果有必要,可以恢复整个服务器,即使它是全新的。

2.经常对本地硬件设备进行备份。理想情况下,备份应该每小时完成一次,对于关键的实时数据甚至可能更频繁。对更频繁备份的限制又回到了系统类型。磁带备份通常设置为在夜间执行这项工作,根据数据量的不同,甚至可能无法在早上完成。

另一方面,基于映像的备份可以更快地完成。

哈克比解释说:“UNG使用的系统可以配置为每五分钟为我们的服务器拍摄快照。”“因此,我们确定了处理我们所有医疗保健信息的服务器,并每小时对它们进行多次备份。不太重要的服务器每小时备份一次,所以我们知道,如果出现问题,我们有一个不超过一小时的备份,我们可以迅速恢复。”

3.为了实现冗余,本地存储的数据也会备份到云中。在预测系统可能崩溃的每种情况时,将任何本地硬件设备备份到云是有意义的。

即使是技术水平较低的企业所有者现在也至少对云计算的概念有所熟悉,这实际上意味着整个网络也备份到位于美国其他地方的远程服务器上。云服务器有自己的冗余保护和备份,非常安全。

通过这种方式,如果本地硬件设备在火灾、洪水、地震或其他自然灾害中发生故障或被破坏,则可以直接从云访问整个网络。虽然罕见,但这些事件的发生比许多人意识到的更有规律。

4.每天对备份进行测试,以确保数据没有损坏。尽管有一些基本的工具可以检查备份是否成功完成,以及在某些情况下数据是否损坏,但这些工具是有限的,而且通常不常见。对于较小的公司,这种监视通常不是分配给IT,而是分配给业务所有者、办公室经理或其他员工。

为了防止备份的潜在数据损坏,一些公司现在更进一步,对基于映像的备份进行日常测试和验证。然后每周将每日报告发送给客户,向他们的客户显示备份已经过测试并处于良好的工作状态。

5.备份,无论是本地的还是云端的,在紧要关头都可以充当虚拟服务器。除了数据本身之外,还对备份进行了配置,以便在服务器或其他硬件发生故障时启动它们并充当虚拟服务器。无论是本地硬件设备还是云中,如果需要,备份都可以配置为充当完整服务器。

对于用户(无论是雇员还是顾客)来说,“虚拟”网络的功能和行为与原始服务器完全相同,以至于他们无法识别其中的区别。

一旦硬件被修复或更换、测试并重新联机,所有数据(包括在停机期间更改或添加的所有数据)都将被复制到它,并将切换回实际服务器。

以分钟为单位的网络恢复成本
对于任何费用,企业所有者都有理由关注更全面的备份和恢复系统的成本。

一些提供商正在转向基于所涉及的数据量的业务连续性解决方案的固定月费模式。统一费率包括所有软件、硬件设备、云存储、监控,甚至事件发生时的支持和帮助。

这与按小时收费的IT支持以及购买或租赁云存储硬件设备等的额外费用形成鲜明对比。这些费用加起来,甚至可能在重大数据丢失或网络崩溃的情况下飙升。

根据哈克比的说法,企业主应该考虑像保险这样的全面的业务连续性解决方案。他表示:“没有人喜欢为保险付费,但当他们需要使用保险时,他们肯定会很高兴为保险付费。”

有了适当的解决方案,以数据为中心的企业和负责维护网络的人可以放心,如果发生任何事情,他们的系统可以迅速恢复。

Jeff Elliott是加州托伦斯的技术作家。