什么是ELT?
ELT代表提取、加载和转换。它是一个数据集成过程,用于将原始数据从源服务器传输到目标服务器上的数据系统(例如数据仓库或数据湖),然后调整数据以用于下游用途。
提取和加载过程可以与转换阶段隔离。将加载阶段与转换过程隔离消除了这些阶段之间的固有依赖关系。它可以包含转换所需的数据,提取和加载过程可以包含将来可能必不可少的数据元素。加载过程可以获取整个源数据并将其加载到仓库中。
ELT的优势
ELT具有以下多种优势:
实时、灵活的数据分析。用户可以灵活地分析整个数据集,例如实时信息,以各种方式移动,而无需等待信息提取、转换和加载。
降低成本和维护 ELT受益于强大的基于云的平台生态系统,这些平台提供更低的成本和多种计划选项来存储和处理数据。鉴于所有信息持续可用且转换过程通常是自动化和基于云的,ELT过程通常需要较低的维护。
高效 ELT可以利用现有硬件的计算能力来执行转换。
灵活的结果数据集 使用ELT时,可以将整个数据集移动到目标位置。如果不想在移动数据之前转换数据,或者想要目标数据的模式灵活,这将非常有用。
数据几乎很简单但规模巨大,包括日志文档和传感器数据。在这种情况下,在目标中进行的转换可能相对简单,而好处来自于目标数据存储快速加载海量数据的能力。
简化管理 - ELT将加载和转换服务分开,最大限度地减少这些阶段之间的相互依赖性,降低风险并集成项目管理。
利用最新技术 - ELT解决方案利用新技术的强大功能,在整个企业中转移开发、安全和合规性。
可扩展性 - 云基础设施和托管服务(如集成平台即服务 (iPaaS) 和软件即服务 (SaaS))的可扩展性使组织能够随时扩展资源。它们插入即使对于大规模数据转换服务也必不可少的计算时间和存储空间。
面向未来的数据集 - ELT实现可以精确地用于数据仓库系统,但ELT用于数据湖方法,其中数据从多个来源收集。因此,它与转换过程的分离相结合,简化了对仓库架构进行最终修改的操作。