BigQuery - 连接外部数据源



到目前为止,本教程的大部分内容都涉及 UI 和云终端,现在是时候探索通过外部数据源连接 BigQuery 了。

在 UI 中编写查询的局限性

虽然在 BigQuery Studio 中编写查询可能很方便,但事实是,这只能满足有限的用途:

  • 初步开发 SQL 查询或脚本
  • 调试查询
  • 进行抽查或质量保证

仅仅在 UI 中编写和运行查询并不能帮助交付自动化数据解决方案。这意味着在 BigQuery SQL 环境中,您无法:

  • 访问 BigQuery API
  • 与 Airflow 集成
  • 创建 ETL 管道

外部 BigQuery 集成

在接下来的章节中,我们将探讨如何将 BigQuery 与以下内容集成:

  • BigQuery 计划查询
  • BigQuery API (Python)
  • Cloud Composer / Airflow
  • Google 表格
  • BigQuery 数据传输

外部 BigQuery 集成使开发人员能够利用 SQL 的强大功能来执行以下任务:

  • 创建自动化提取加载 (EL) 作业
  • 创建提取转换加载 (ETL) 作业
  • 创建提取加载转换 (ELT) 作业
广告