什么是元数据中心?
元数据中心用于处理决策处理产品之间技术元数据的交换和分发。它主要设计供技术人员在数据仓库的增长和维护期间使用。该中心有四个要求:
元数据中心应在共享元数据环境中提供系统和产品之间元数据的交换。该中心必须具有记录和开放的程序化对象接口(例如,使用 COM 或 CORBA),允许第三方工具控制中心的服務。还应支持用于元数据交换的文件传输结构,该结构支持行业识别文件格式(例如,逗号分隔文件、元数据联盟 MDIS、Microsoft XML 交换格式)。
元数据中心必须为元数据的管理和共享提供持久存储。存储中的元数据应可以通过上面定义的对象 API 和文件传输方法以及提供的 GUI 和 Web 用户交互界面进行维护。
还需要一个交互式和批处理的元数据影响分析和文档编制功能。该中心必须提供一个代理接口,可以以用户定义的间隔扫描和捕获本地产品和系统中的新元数据或修改后的元数据,以添加到元数据存储中。
用于维护存储中元数据的元数据管理器应支持版本和库控制功能,这些功能可以创建元数据更改的历史记录并支持组开发。在大型分布式环境中,管理员应能够在多个中心服务器和元数据存储之间物理分区元数据环境。
元数据中心至少应能够管理数据仓库信息存储定义。支持的格式应包括关系表和列,以及多维度度量和维度。
可以处理的另一种类型的元数据是有关用于创建数据仓库记录的数据源以及在将这些源数据加载到仓库之前对其进行转换的信息。
但是,已认识到当前的 ETL 工具使用其专有的转换方法,这使得创建用于管理此类元数据的通用工具变得复杂。产品至少应提供以自由格式文本格式记录数据源和转换元数据的功能。
理想情况下,该中心还必须记录与通用业务模型和业务智能工具以及分析软件用来访问仓库数据的业务视图相关的业务元数据的详细信息。
广告