通过数据传播共享数据有哪些不同的方法?
数据传播是指根据传播规则将一个或多个源数据仓库中的数据分配到另一个本地访问数据库。数据仓库需要每天管理大量数据。数据仓库可以从少量信息开始,并通过不断地与多个数据源共享和接收信息,日复一日地增长。
随着数据共享的推进,数据仓库管理成为一个主要问题。需要数据库管理来更有效地管理公司信息,并将其划分为多个子集、排列和时间框架。这些数据资源需要不断更新,更新过程包括将大量记录从一个系统移动到另一个系统,并在业务智能系统之间来回移动。
在短时间内批量执行大量数据移动是很常见的,而不会影响仓库的操作软件或数据的性能或可用性。要更改的信息量越大,过程就越具挑战性和复杂性。因此,数据仓库管理的责任在于找到更快地转换海量信息的方法,以及识别和仅传输由于上次数据仓库更新而发生更改的数据。
开发了几种方法来解决通过数据传播共享数据相关的问题,如下所示:
批量提取 - 在这种数据传播技术中,复制管理工具或空实用程序用于派生操作关系数据库的全部或一部分。通常,提取的信息然后使用文件传输协议 (FTP) 或任何其他类似技术传输到目标数据库。提取的数据可以更改为主机或对象服务器上的对象使用的格式。
文件比较 - 此技术是批量移动方法的创新。此阶段将最近提取的操作数据与过去版本进行比较。之后,生成一组增量更改数据。增量更改的处理方式与批量提取中使用的方法相同,只是增量更改用作计划阶段内对象服务器的更新。此方法推荐用于较小的文档,其中只有部分数据更改。
更改数据传播 - 此技术捕获并记录对文件的更改作为软件更改过程的一部分。可以使用多种技术来执行更改数据传播,包括触发器、日志退出、日志后处理或 DBMS 扩展。生成增量更改文件以包含捕获的更改。
完成源事务后,可以将更改数据转换为对象数据库并更改。这种数据传播有时被称为近实时或连续传播,用于在源系统非常短的时间内保持对象数据库同步。