SAP BODS - 性能优化技巧



ETL 作业的性能取决于您使用 Data Services 软件的系统、移动次数等。

还有其他一些因素会影响 ETL 任务的性能。它们是 -

  • 源数据库 - 源数据库应设置为快速执行Select语句。这可以通过增加数据库 I/O 的大小、增加共享缓冲区的大小以缓存更多数据以及不允许对小型表进行并行处理等来实现。

  • 源操作系统 - 源操作系统应配置为快速从磁盘读取数据。将预读协议设置为 64KB。

  • 目标数据库 - 目标数据库必须配置为快速执行INSERTUPDATE。这可以通过 -

    • 禁用归档日志。
    • 禁用所有表的重做日志。
    • 最大化共享缓冲区的大小。
  • 目标操作系统 - 目标操作系统必须配置为快速将数据写入磁盘。您可以打开异步 I/O 以使输入/输出操作尽可能快。

  • 网络 - 网络带宽应足以将数据从源系统传输到目标系统。

  • BODS 存储库数据库 - 为了提高 BODS 作业的性能,可以执行以下操作 -

    • 监控采样率 - 如果您在 ETL 作业中处理大量数据集,请将采样率监控到更高的值以减少对日志文件的 I/O 调用次数,从而提高性能。

    • 如果在作业服务器上配置了病毒扫描,您还可以将 Data Services 日志排除在病毒扫描之外,因为它会导致性能下降

  • 作业服务器操作系统 - 在 Data Services 中,作业中的一个数据流会启动一个‘al_engine’进程,该进程会启动四个线程。为了获得最佳性能,请考虑一个每次在每个 CPU 上运行一个‘al_engine’进程的设计。作业服务器操作系统应以这样的方式进行调整,即所有线程都分布到所有可用的 CPU 上。

广告