企业备份&灾备专题

2021-03-14

维持业务持续性对于企业至关重要, 关键业务系统宕机可能会对企业带来重大影响,企业声誉、客户满意度或公司的财务的状况都可能受到难于挽回的重大损失。 因此,构建高可用高容灾的IT系统和建设IT灾备系统,具有显而易见的价值。 在灾备解决方案的选定上,企业需要先制定好两个重要指标:恢复时间RTO(故障恢复时间),和恢复点RPO(可忍受数据损失的时间点)。基于这两个关键业务指标,企业 IT部门可以设计相应的应用架构、备份架构和灾备体系,通过使用一系列镜像/快照等技术手段,来实现相应系统的连续性服务水平。 在传统做法中,实施较高要求的容灾和灾备系统,往往不光要求企业花费大量时间和精力,而且部署复杂且价格昂贵。这对于多数企业,特别是中小型企业,都是一个巨大的负担。使用公有云的 基础设施来实现数据保护、备份归档和灾难备份,拥有传统IT无法比拟的巨大优势。 本文首先对灾备的基本概念做概况介绍,之后将利用wordpress模板模拟经典web hosting架构的应用场景,给出基于AWS的不同指标的4种备份/灾备方案,并做关键指标的对比。 本文概括介绍了在AWS上搭建容灾备份系统的四大方案。每一种方案都给出了具体的解决方案架构图成本估算具体执行步骤 和 自动化脚本。 企业可结合自己对应用系统PTO和PRO的要求以及成本预算,选择适合自己的灾备方案。

 

本文目录

  1. 关键指标 RPO & RTO
  2. 灾备类型
  3. 模拟内容
  4. AWS 组件的计费模型
  5. 不同场景下的解决方案
  6. 脚本下载
  7. 总结

关键指标 RPO & RTO

  1. RTO (Recovery Time Objective,复原时间目标)是指灾难发生后,从IT系统当机导致业务停顿之时开始,到IT系统恢复至可以支持 各部门运作、恢复运营之时,此两点之间的时间段称为RTO。比如说灾难发生后半天内便需要恢复,RTO值就是十二小时。
  2. RPO (Recovery Point Objective,复原点目标)是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,恢复得来 的数据所对应时的间点。如果现时企业每天凌晨零时进行备份一次,当服务恢复后,系统内储存的只会是最近灾难发生前那个凌晨零时的资料。
  3. 该图解释了 RTO 和 RPO 与时间轴的关系。