RPO与RTO:用例子,提示解释的主要差异

恢复点目标和恢复时间目标使组织能够了解它可能会失去多少数据以及它可能关闭多长时间,备份和博士计划的关键元素。

谈到数据备份和恢复时实现最佳结果涉及使用两个重要指标:恢复时间目标和恢复点目标。在开发数据备份和恢复计划以及传统的业务连续性和技术灾难恢复计划中,这两个度量都是必不可少的。

重要的是要检查每一个指标,它们在上述领域中的作用,如何计算它们和它们的成本影响,以及如何将它们纳入各种弹性计划。

什么是rto?

恢复时间目标(rto)指定从中断事件发生到受影响资源必须完全运行并准备好支持组织目标所需的时间。图1描述了RTO指标。

当资源中断时,可能需要进行一些操作,例如更换损坏的组件、重新编程和测试,然后才能将资源恢复到正常的服务和业务状态(BAU)。采油时间与支持采油所需的成本成反比关系。具体来说,RTO的时间越短,回收成本就越高,反之亦然。因此,在确定RTO值时,业务部门领导的参与是非常重要的。例如,他们可能希望将30分钟的恢复时间作为目标时间,但实现该目标的成本可能令人望而却步。

RTO时间表
图1所示。RTO可以用秒、分钟、小时或天来度量。

RPO是什么?

恢复点目标(RPO)涉及数据备份和恢复活动时尤为重要。组织 - 如银行或信用卡公司 - 在一天的过程中进行许多交易,可能需要备份更频繁地发生,但几乎实时地发生,因此他们将拥有最新的关键数据,以获得其特定需求对于未来的交易。这意味着数据一旦上次备份时,就不得超过,这意味着数据将尽可能的最新状态。例如,具有非常低值的RPO,例如少于一分钟,可能需要连续复制关键文件,数据库和系统。这是RPO,可以尽可能备份数据。图2描绘了RPO及其与RTO的关系。

再一次,我们看到RPO值和实现它的成本之间的反比关系。非常短的RPO(例如10到30秒)意味着必须非常频繁地备份数据,这就需要使用高速备份技术,如数据镜像或连续复制,尤其是在这种情况下备份存储在站点之外的云中或其他安排。再加上传输大量数据所需的网络带宽,实现所需的数据可用性的成本可能非常高。

RPO时间表
图2。RPO从故障发生的那一刻开始,按时间倒序表示。

RTO与RPO:相似性和差异

这两个指标都是数据备份和数据恢复计划中使用的重要元素。理想情况下,这两个特性都应该是关键的备份和恢复特性,以确保关键数据和系统在需要时可用,特别是在中断事件之后。表1提供了灾后场景中关于这两个术语的更多详细信息:

情况

计划的RPO

实际的RPO

计划rto.

实际RTO

分析

关键任务应用

0.5人力资源

1.5小时

0.5人力资源

2.0小时

应用备份资源不足;技术不能很快恢复

关键的数据库

0.25小时

2.0小时

0.25小时

2.0小时

应用备份资源不足;技术不能很快恢复

关键网络交换机

NA

NA

0.5人力资源

2.0小时

技术不能很快恢复

暖通空调系统及相关应用

0.25小时

2.0小时

0.25小时

2.5小时

暖通空调系统备份资源不足;暖通空调系统无法迅速恢复

表格1

在本例中,业务关键型应用程序和数据库都被该事件中断。对于每一项资产,rpo和rto都是相当激进的;结果显示,这些资产没有像预期的那样得到很好的保护。恢复所需的持续时间表示需要:

  • 为应用优先级重新配置存储资源和备份平台;
  • 可作为回收过程的一部分使用的备件;和
  • 更加关注关键基础设施和环境系统,并努力维护业务运营。

除了在业务连续性计划和技术灾难恢复计划中使用外,它们在实践中也有很大的不同。RTOs是指定的一个事件发生。使用RPO之前一个事件发生。然而,当两者相连接时,一个短RTO通常需要一个同样短的RPO(见表1),特别是当数据保护是要求.如果灾难恢复策略只处理系统的备份和恢复(参见表1),那么RTO值可能足以确定恢复将如何进行。但是,如果要恢复的系统还处理关键数据(参见表1),那么两个指标都应该同步。

计算RPO和RTO

业务影响分析(BIA)旨在识别相关的RTO和RPO值。风险分析还可以为这些度量标准的值分配提供有价值的输入。偏差识别关键任务业务流程,识别确保BAU所需的技术、人员和设施。他们还可能识别出中断造成的财政影响,如收入损失或罚款。

根据业务单位负责人和高级管理人员的输入,定义了数字值,从业务角度表示从中断恢复的最佳情况现在,不存在计算RTO/RPO值的数学公式。它们是严格的数值时间值。例如,对于相当关键的服务器,RTO可能是一个小时,而对于不那么关键的数据事务文件,RPO可能是24小时,并且可能也支持使用备份磁带存储设备

如前所述,随着RTO / RPO数值的降低,实现这些指标的成本可能会增加。确定真实成本的唯一方法是首先识别所需的RTO / RPO值,然后进行研究以确定是否发生中断时达到度量所需的内容。然后,它可能需要建议业务部门领导和高级管理层增加的投资。

这是可能发生潜在冲突的地方,因为如果管理层不想花费额外的资金来实现他们指定的所需指标,他们必须理解,如果发生破坏性事件,这种阻力可能会招致额外的风险。理想情况下,管理层在做出决定之前,必须意识到潜在的财务问题和其他事件的影响,比如声誉受损。

实现RPO和RTOS的提示

根据结果风险分析和BIA, IT管理员应该很好地了解可能威胁IT基础设施的事件类型。这些分析可能为指标提供评级,指示发生的频率、发生的可能性、对组织的影响(例如,运营和财务),还可能识别漏洞(例如,某些应用程序的低备份频率)和潜在威胁(例如,附近建筑活动造成停电)。

一旦确定和量化了基于风险的问题,IT管理人员就可以将这些因素转化为基础设施资产,并从该评估中确定可以帮助减少威胁或发生严重程度的措施。然后,这些分析可以转化为RPO和RTO值,应经业务部门管理和高级管理层审查和批准。假设已被接受,它可以在建立现实RPO和RTO值的过程中识别采取的行动(例如,更多数据存储,更多数据存储,更多的网络带宽,更频繁的系统性能审查)。

将RTO / RPO构建到数据备份和恢复计划中

在数据备份、数据恢复和其他弹性(如BCDR)计划中纳入RTO/RPO指标至关重要,并确保用于实现这些指标的流程、人员和技术资源是适当的。RTO/RPO值可以包括在计划中供参考和指示恢复栏设置在哪里

对于数据备份和恢复,这些指标对于规划至关重要,因为它们有助于确定实现目标的最佳数据备份和技术配置。例如,由于审核员可以寻找这些值的证据作为关键数据备份/恢复控制,它们也是重要的。

深入了解存储管理工具

搜索灾难复苏
搜索数据备份
搜索融合基础设施
关闭
Baidu