BigQuery 与本地 SQL 引擎



随着SQL 已经存在了 40 多年,BigQuery 并不是第一个 SQL 环境。在 BigQuery 发布之前,SQL 开发人员主要使用本地或“本地”数据库。

允许开发人员管理和交互数据库的系统称为数据库管理系统 (DBMS)。

在“云工程师”或“数据工程师”职位名称流行和广泛使用之前,那些使用DBMS 工具的人员拥有诸如“架构师”之类的职位。通常,这个职位名称的含义非常直接,因为那些使用数据库的人员维护着物理和数字基础设施。

数据建模

随着数据库技术的演进,架构师的职责主要涉及一项称为数据建模的任务。

虽然像 INSERT() 这样的函数可以使从源获取数据并将其添加到数据库中看起来很容易,但在采用数据建模的组织中,如何存储和塑造数据需要经过大量的思考。

流行的数据建模概念包括诸如“星型模式”或“规范化”和“范式”之类的短语。

BigQuery 与任何传统 DBMS 有什么不同?

虽然在创建 BigQuery 表格时仍然建议遵循最佳实践,但 BigQuery 比传统的 DBMS 接口更开箱即用。

BigQuery 在以下方面与更“传统”的 DBMS 不同 -

  • 可扩展性 - 由于 Google 数据中心提供的惊人数量的云存储,BigQuery 可以扩展以满足几乎任何存储或查询需求。
  • API 集成 - BigQuery 的 SQL 引擎可以通过编程方式利用,而像 Postgre 这样的 DBMS 只能运行本机 SQL 查询。
  • ML/AI 功能,与 Vertex AI 集成。
  • 可用于长期存储的更多特定数据类型
  • 一种 Google 特定的 SQL 方言,Google 查询语言 (GQL),它包含比更多传统 SQL 方言更专业的函数。

从用户的角度来看,BigQuery 还提供了有关执行统计信息和用户活动的更多可见性 -

  • 允许用户在执行随附的 SQL 之前查看查询是否可接受
  • 提供执行计划和查询谱系
  • 扩展的元数据存储以提供对查询使用情况、存储和成本的洞察

BigQuery 确实是基于云的 SQL 查询的标准,它始于 Google Cloud Console。

广告