选择数据源的标准是什么?
选择数据源的标准有很多,如下所示:
数据可访问性 - 如果存在两种可能的数据源,一种存储在项目团队中最年轻成员出生前就编写的一组程序维护的二进制文件中,另一种来自读取二进制文档并支持更多处理的系统,那么决策就很明显了。
数据准确性 - 当数据从一个系统传递到另一个系统时,会进行许多修改。有时会添加来自其他系统的数据元素,有时会处理现有元素以创建新元素,而其他元素则被删除。
每个系统都能很好地执行其功能。但是,识别原始数据可能会变得困难或不可能。在某些情况下,数据不再代表业务分析所需的内容。如果您提供来自这些下游系统的数据,用户可能会质疑其准确性。
项目进度安排 - 在许多组织中,数据仓库项目作为现有 OLTP 系统重写的部分内容开始。随着新的系统开发项目开始展开,那些确信数据仓库价值的业务用户开始坚持要求尽早实施数据仓库。
为了提供历史数据,您需要将现有系统中的数据包含在数据仓库中。如果旧系统的重写被搁置,数据仓库可以继续利用当前系统。一旦新系统发布到生产环境,数据馈送就可以切换到它。在许多情况下,可以在完成新操作系统之前交付数据仓库。
一些维度信息通常与事务或事实数据一起出现,但通常很少,而且通常仅以代码的形式出现。用户可能需要和需要的附加属性是从多个系统或联合主文件中获取的。
在许多情况下,可能存在多个主文件,特别是对于客户维度而言。通常存在跨组织使用的单独文件。销售、市场营销和财务部门可能有他们自己的客户主文件。
有两个难题:首先,这些文件中包含的客户可能不同,并且每个客户的属性也可能不同。其次,公共信息可能不匹配。如果可以拥有无限的时间和金钱,则可以从所有来源提取丰富的数据,然后将其组合成客户的单个综合视图。
在大多数情况下,没有足够的时间或金钱来一次性完成所有这些工作。在这些情况下,建议用户优先考虑信息,从您可以开始的地方开始,并在将来扩展。
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP