BigQuery - 分区和集群



由于本教程中已经使用了“分区”“集群”这两个术语,因此提供更多上下文信息很有帮助。

什么是分区和集群?

这两个术语用于描述优化数据存储和处理的两种方法。

分区是指开发人员如何分割数据,通常(但并非总是)按日期元素(如年、月或日)进行分割。集群描述了如何在指定分区内对数据进行排序。

要使用任何一种存储方法,都必须定义一个目标字段。分区只能使用一个字段,而集群可以使用多个字段。

需要注意的是,要应用分区或集群,必须在构建的“创建表”阶段进行。否则,需要删除/重新创建表并更新分区/集群规范。

如何在表中应用分区或集群

要在创建表时应用分区和/或集群,请运行以下命令:

Apply Partitioning or Clustering to a Table

您也可以在 UI 中指定这些指令。在点击“创建表”之前,请花一点时间填写架构创建框正下方的字段。

如果正确应用分区/集群,可以显著降低长期存储成本和处理时间,尤其是在查询大型表时。

广告
© . All rights reserved.