- 数据仓库教程
- DWH - 首页
- DWH - 概述
- DWH - 概念
- DWH - 术语
- DWH - 交付流程
- DWH - 系统流程
- DWH - 架构
- DWH - OLAP
- DWH - 关系型 OLAP
- DWH - 多维 OLAP
- DWH - 模式
- DWH - 分区策略
- DWH - 元数据概念
- DWH - 数据集市
- DWH - 系统管理员
- DWH - 流程管理员
- DWH - 安全
- DWH - 备份
- DWH - 调优
- DWH - 测试
- DWH - 未来展望
- DWH - 面试问题
- DWH 有用资源
- DWH - 快速指南
- DWH - 有用资源
- DWH - 讨论
数据仓库 - 备份
数据仓库是一个复杂的系统,包含大量的数据。因此,备份所有数据非常重要,以便在将来根据需要恢复数据。在本章中,我们将讨论设计备份策略中的问题。
备份术语
在继续之前,您应该了解以下讨论的一些备份术语。
完整备份 - 它同时备份整个数据库。此备份包括所有数据库文件、控制文件和日志文件。
部分备份 - 顾名思义,它不会创建数据库的完整备份。部分备份在大型数据库中非常有用,因为它们允许采用一种策略,即每天以循环方式备份数据库的各个部分,以便每周有效地备份整个数据库。
冷备份 - 冷备份是在数据库完全关闭时进行的。在多实例环境中,所有实例都应关闭。
热备份 - 热备份是在数据库引擎运行时进行的。热备份的要求因 RDBMS 而异。
在线备份 - 它与热备份非常相似。
硬件备份
确定使用哪种硬件进行备份非常重要。处理备份和恢复的速度取决于所使用的硬件、硬件的连接方式、网络带宽、备份软件以及服务器 I/O 系统的速度。在这里,我们将讨论一些可用的硬件选择及其优缺点。这些选择如下:
- 磁带技术
- 磁盘备份
磁带技术
磁带选择可分为以下几类:
- 磁带介质
- 独立磁带驱动器
- 磁带库
- 磁带机柜
磁带介质
存在多种磁带介质。下表列出了一些磁带介质标准:
磁带介质 | 容量 | I/O 速率 |
---|---|---|
DLT | 40 GB | 3 MB/s |
3490e | 1.6 GB | 3 MB/s |
8 mm | 14 GB | 1 MB/s |
需要考虑的其他因素如下:
- 磁带介质的可靠性
- 每单位磁带介质的成本
- 可扩展性
- 磁带系统升级成本
- 每单位磁带介质的成本
- 磁带介质的保存期限
独立磁带驱动器
磁带驱动器可以通过以下方式连接:
- 直接连接到服务器
- 作为网络可用设备
- 远程连接到其他机器
将磁带驱动器连接到数据仓库可能会遇到一些问题。
假设服务器是 48 节点的 MPP 机器。我们不知道要将磁带驱动器连接到哪个节点,也不知道如何在服务器节点上分配它们以获得最佳性能,同时最大程度地减少服务器中断和内部 I/O 延迟。
将磁带驱动器连接为网络可用设备需要网络能够处理巨大的数据传输速率。确保在您需要时有足够的带宽可用。
远程连接磁带驱动器也需要高带宽。
磁带库
将多个磁带加载到单个磁带驱动器中的方法称为磁带库。当库完成当前磁带的操作时,它会卸下当前磁带并加载下一盘磁带,因此一次只能访问一盘磁带。价格和功能可能会有所不同,但它们通常都能够执行无人值守备份。
磁带机柜
磁带机柜提供大型存储容量。磁带机柜可以存储和管理数千盘磁带。它们可以集成多个磁带驱动器。它们具有用于标记和存储所存储磁带的软件和硬件。机柜通常通过网络或专用链路远程连接。我们应该确保连接的带宽能够胜任工作。
磁盘备份
磁盘备份的方法包括:
- 磁盘到磁盘备份
- 镜像断开
这些方法用于 OLTP 系统。这些方法最大程度地减少数据库停机时间并最大程度地提高可用性。
磁盘到磁盘备份
在此,备份存储在磁盘上,而不是磁带上。磁盘到磁盘备份出于以下原因而进行:
- 初始备份速度
- 恢复速度
将数据从磁盘备份到磁盘比备份到磁带快得多。但是,它是备份的中间步骤。稍后将数据备份到磁带上。磁盘到磁盘备份的另一个优点是它为您提供了最新备份的在线副本。
镜像断开
其想法是在工作日期间将磁盘镜像以提高弹性。当需要备份时,可以断开其中一个镜像集。此技术是磁盘到磁盘备份的一种变体。
注意 - 可能需要关闭数据库以保证备份的一致性。
光盘库
光盘库允许将数据存储在近线存储中。此技术允许以与磁带库或磁带机柜相同的方式管理大量光盘。此技术的缺点是其写入速度比磁盘慢。但光学介质提供了长寿命和可靠性,使其成为归档的良好介质选择。
软件备份
有一些软件工具可以帮助备份过程。这些软件工具作为软件包提供。这些工具不仅可以进行备份,还可以有效地管理和控制备份策略。市场上有许多软件包可用。其中一些列在下表中:
软件包名称 | 供应商 |
---|---|
Networker | Legato |
ADSM | IBM |
Epoch | Epoch Systems |
Omniback II | HP |
Alexandria | Sequent |
选择软件包的标准
选择最佳软件包的标准列在下面:
- 随着磁带驱动器的增加,产品的可扩展性如何?
- 该软件包是否具有客户端-服务器选项,或者它必须在数据库服务器本身上运行?
- 它是否适用于集群和 MPP 环境?
- 需要多少程度的并行性?
- 该软件包支持哪些平台?
- 该软件包是否支持轻松访问有关磁带内容的信息?
- 该软件包是否了解数据库?
- 该软件包支持哪些磁带驱动器和磁带介质?