科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道超级网管经验谈:数据备份与恢复设计

超级网管经验谈:数据备份与恢复设计

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

企业应用程序可以生成大量的电子数据,并且数据存储需求还将继续增加。企业需要找到能够以最有效的方式保护其数据,而不影响其数据中心提供服务的方法。

作者:zdnet安全频道 来源:论坛整理 2008年7月2日

关键字: 数据备份 网络管理

  • 评论
  • 分享微博
  • 分享邮件

    企业应用程序可以生成大量的电子数据,并且数据存储需求还将继续增加。企业需要找到能够以最有效的方式保护其数据,而不影响其数据中心提供服务的方法。而且,数据保留、存档和存储要求对备份提出了新的挑战,因为它们经常超出常规备份和恢复技术的能力。由于数据中心地理位置日趋分散,并且要求分配给备份的停机时间极少(如果有的话),以使应用程序持续可用,这些因素使得数据保护问题进一步复杂化。

    组织对数据的不间断可用性的依赖,要求进行频繁的备份,以确保重要的数据得到保护。这些看上去无法协调的要求对组织的IT部门造成了巨大的压力。他们必须找出提高备份速度的方法,并同时减少备份过程对数据中心所提供的日常关键性服务的干扰程度,快速且高效地恢复数据也同等重要。

备份与恢复方案设计概述

    备份和恢复解决方案的设计需要考虑组织的业务要求及其运营环境。所部署的备份和恢复解决方案必须是可预测的和可靠的,并且可以尽可能快地处理数据。

     组织在管理数据方面所面临的挑战包括以下内容。

     确保99.999%的服务可用性。

     管理数据量的增长。

     在降低复杂性并控制成本的前提下,管理存储基础架构以改进由服务等级协定(SLA)所定义的服务质量(QoS)。

     将应用程序与存储和数据管理要求集成在一起。

     使用简短的数据备份窗口或不使用数据备份窗口进行操作。

     支持无法运行最新技术的现有IT系统。

     管理导致管理分散和成本增加的技术孤岛。

     评估数据价值,以便可以为各种数据类型应用最适当的策略。

1.数据可能丢失的原因

    备份Windows环境以保护关键的数据,并在发生数据丢失的情况下使之能够快速还原是非常重要的。数据丢失可能由下列原因造成。

     硬盘子系统故障。

     电源故障(导致数据损坏)。

     系统软件故障。

     数据被意外或恶意删除或修改。

     病毒。

     自然灾害(如火灾、洪水和地震等)。

     盗窃或蓄意破坏。

    组织必须能够从任何停电或灾难中快速恢复,无论涉及的情形是简单的组件故障还是站点的完全破坏。因此,在设计备份和恢复体系结构时,应考虑所有类型的故障。选择的体系结构必须建立在定义完善的系统可用性要求之上,并考虑每个服务器的内容和配置。

2.评估情况

    对于引入Windows环境中的每个操作系统和应用程序,请考虑下列问题。

    可能的故障情况是什么?

    重要数据是什么及位于什么位置?

    需要备份的频率为多少?

    与增量备份或差异备份相比,什么时候应该进行完全备份?

    将使用什么备份媒体(磁盘、光盘还是磁带)?

    是在联机还是脱机状态下执行备份?

    是手动开始进行备份,还是按照计划自动执行备份?

    使用什么来测试备份,是否有效?

    备份将存储在什么位置(站点上、站点之外或两者)?

备份计划设计

    一个好的备份和恢复体系结构应该包括灾难避免计划、程序和用于从灾难或停电中恢复的工具,以及执行恢复的详细程序和标准。对于每个目标区域,体系结构都应当清晰地定义成功实现所需的人员、过程和技术。

1.灾难避免计划

    灾难避免计划必须预见可能影响系统运行的事件并准备好这类事件的应对措施。例如,可能中断Internet服务的事件有Internet连接问题、无法随时替换的组件的小故障或者较复杂的软件问题。

    成功的灾难避免计划的元素包括地理冗余和备份磁带的远程存储。使用冗余的和地理位置较远的数据中心是一种很好的方式,可以确保区域性灾难不会导致丧失提供服务的能力。将备份磁带从各个数据中心移走,是一种避免同时失去数据中心和数据中心备份机制的好方法。如果数据很重要,可以使用若干个站点外存储设备。站点外存储不会显著提高备份和恢复体系结构的成本,许多公司都提供站点外存储服务,并会在需要轮换磁带时上门接收并运送备份磁带。

    灾难避免计划必须以为所承载的特定应用程序定义的性能和可用性要求为基础。例如,如果应用程序为特定的区域服务,则可能无须在计划中包括另外一个位于遥远地理位置的数据中心。

2.灾难恢复计划

    灾难恢复计划使组织能够从无法避免的灾难和停电中进行恢复。在开发该计划时,必须考虑下列问题。

    在灾难或停电期间业务运行可以继续吗?灾难恢复计划应当包括在灾难或停电(包括网络停电)期间维持业务运行的过程。例如,即使在服务器无法运行时,销售部门的电话铃仍会照常响起,这样员工可能需要手动接收订单,直到服务器恢复运行。每个部门都应当制订这类情况的相应策略。

    如何创建和维护灾难恢复计划?为了确保能够成功,必须正确管理灾难恢复计划。建议由组织的一个或多个成员负责管理组织的灾难准备工作。必须有人负责安装和维护硬件保护设备,确保所有部门都有服务器发生临时故障的计划,确保进行了备份并且定期轮换到站点外,并且制作了全面的文档,以支持灾难恢复计划。

3.开发备份解决方案的最佳做法

    开发备份解决方案时,用户必须要做到以下几点:

    在开发和测试备份和还原策略时,配置适当的人员,并使用适当的资源。

    创建一个数据保护组织结构图,该图中包含每个人的责任和联系信息。

    对需要保护的各个卷执行初始完全备份。

    备份各个服务器的系统状态,并确保每个域控制器都包括了Microsoft Active Directory目录服务。

    打印并检查备份报告,以确保所有文件都正确地进行了备份。

    定期执行测试数据恢复,以验证文件备份是否正确。

    确保备份媒体、系统和服务器所采用的保护方式可以防止恶意管理员将盗窃的数据还原到用户的服务器上。

    开发和实现灾难恢复测试计划以确保备份数据的完整性。

    组织必须能够从灾难中快速恢复,无论涉及的情形是简单的组件故障还是站点的完全破坏。有了正确的计划,备份和恢复服务可以使组织从灾难中快速恢复。

    备份和恢复计划应当包括对当前业务要求的评估,以使管理员可以实施适当的解决方案,为未来的发展提供条件。灾难避免计划应当能够预测可能的灾难,并针对无法防止的灾难制定恢复计划。

 备份和恢复服务设计

    为了保持业务的成功运转,各个组织都有赖于一些关键性的数据。备份和恢复技术是数据保护策略的基础,可以帮助组织达到数据的可用性和可访问性的要求。数据中心可以使用冗余组件和容错技术(如服务器集群、软件镜像或者硬件镜像)通过复制重要数据来确保较高的可用性。但是,单单是这些技术并不能解决由数据损坏或删除导致的问题,造成数据损坏或删除的原因可能是应用程序错误、病毒、安全漏洞或用户错误。出于行业或法律审计方面的原因,用户可能还需要以存档的方式保存信息。这一要求也可能适用于事务性数据、文档和协作信息(如电子邮件)。因此,用户必须具备一个包含综合性备份和恢复机制的数据保护策略,以防止数据因意外停电或灾难而丢失,并达到数据保存的相关行业要求。

    有若干种技术,提供了几种实现备份和恢复的选项。用户应该根据其组织为自己的数据中心所提供的服务而定义的业务要求和服务级别协议(SLA)来选择特定的技术。例如,某种消息服务很可能被认为是数据中心所提供的最重要的服务。因此,该消息服务的SLA就比其他服务的SLA关联更多的资源。需要通过与各个服务的用户合作来定义SLA。

    对业务要求进行详细分析并为各个服务定义了双方都可以接受的SLA后,就可以开始对备份和恢复解决方案的技术层面进行研究了。以下部分讨论了不同的备份模式、类型、拓扑、设计备份和恢复解决方案时所必须考虑的因素。

2.备份策略

    规划备份解决方案时,应考虑多种因素,如只备份必要的数据,仔细安排备份及选择执行适当的备份类型。

    1)避免不必要的备份

    设计备份策略时,用户往往对环境中的所有服务器执行完全备份。但是请注意,备份的目的是在发生停电或灾难后成功地还原环境。因此,用户的备份策略应专注于下列目标。

    要还原的数据应容易找到。

    还原应尽可能快。

    如果不加选择地备份所有服务器,要恢复的数据量便非常庞大。虽然当前的磁带存储和备份产品能够快速进行数据还原,但如果所有数据都需要从磁带还原,就可能会增加停工期。例如,大多数备份产品都要求下列步骤。

   (1)重新安装操作系统。

   (2)重新安装备份软件。

   (3)从磁带中还原备份。

    备份的文件越多,备份所需的时间越长,更重要的是,还原文件的时间就越长。发生灾难时,时间非常重要,因此恢复过程应尽可能短。此外,经常性地执行大型备份会降低网络性能,除非建立专门的备份网络。

    针对环境情况确定了最佳备份策略之后,一定要对整个测试网络执行一次试验性还原。通过这种测试,可以发现存在的问题,并提供在环境中恢复系统的有用经验,而无须承受使生产系统回到联机状态的压力。

    2)选择适当的备份时间

    对于执行有效备份并同时对用户造成最小的影响,各种类型的环境分别有不同的特点。例如,备份电子商务环境与备份企业局域网(LAN)基础架构是不同的。在公司局域网中,网络使用率在基本工作时间之外通常会下降。在电子商务环境中,网络使用率通常在傍晚增加,而且这一水平将一直持续到凌晨,尤其是客户群跨越多个时区时。因此,确定环境备份的最佳时间不大可能。但是,如果遵照下列指导方针,将可以减少对用户的影响。

    计划备份时间以避免峰值使用期。

    不备份不必要的数据。

     定期在测试网络中执行试验性还原,确认备份配置正确无误。

    3)选择适当的存储媒体

    除了确定备份的类型和执行时间外,用户还应当评估可用的存储媒体类型,从而正确选择。

    选择存储媒体时,应考虑下列因素。

     要备份的数据量。

     要备份的数据类型。

     备份窗口。

     环境。

     正在备份的系统和存储设备之间的距离。

     组织预算。

     数据恢复的服务级别协议。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章