当前位置: 首页 > 知识库问答 >
问题:

大查询集群不能降低查询成本

党博超
2023-03-14


我对BigQuery中的集群表(带有日期分区)有一个问题。我有一个由名为entity_id的列集群的表。问题是,我希望在进行由这些集群列过滤的查询时看到字节读取减少,但根据BigQuery Web UI,它无论如何都在进行全扫描。

例如:<br>从<code>project.usersDataset中选择*。users_cluster其中entity_id='405849241'限制为1000
返回:“查询完成(0.570秒,处理862.94 MB)”
这实际上是整个表的大小(862.94MB)

这是表配置:表配置img

编辑:我一直在进行测试,我发现有时,读取的一些字节被保存,但不是太多:
从BigQuery Web Ui查询我期望节省更多的字节成本(返回1个条目并扫描719MB的862MB表),但在bigquery文档中没有任何保证。

有人知道会发生什么吗?
谢谢!

共有1个答案

云弘壮
2023-03-14

来自此链接中提供的BigQuery文档

正在开发的功能

支持群集非分区表。

请检查您的表是群集和分区

注意:根据BigQuery文档,当没有<code>WHERE<code>条件时,也将使用集群

 类似资料:
  • 我正在使用一个嵌入式数据源(ApacheCommonsDBCP1.3),JDBC3DB2JCC,进行Spring批处理。用于BD2数据库和JDK1的jar。5.我知道DBCP2。x已经发布,但由于现有系统(JDK1.5),我现在无法升级。 数据库配置: 我注意到,如果将validationQuery属性与testOnBorrow、testOnReturn和testWhileIdle一起使用,则完成

  • 我正在从一个2.37GB的RDF数据集进行查询,其中包含大约1700万个三元组,并且还维护了该数据集的lucence索引。我尝试了jena-text模块的文本查询,它是在存储的lucene索引的基础上进行搜索的。但是它的性能相当慢,对于一个非常慢的搜索查询需要4秒或更多的时间。 然而,当我使用luncene索引查看器'luke'。索引似乎没有问题,当我从索引中搜索特定的术语时,搜索它需要几毫秒的时

  • 根据AWS文档,我正在使用dynamo db分页: -- -- 令人惊讶的是,当我不设置任何页面大小(1)时,DynamoDb查询速度明显更快,根据文档,情况应该不是这样。我假设dynamo db在默认情况下返回所有结果,如果我们不指定pageSize。

  • 问题内容: 这是一个非常简单的查询: 之前花了15分钟,但是那是在Mysql安装中,缓冲池大小太小,15分钟就可以了,因为这是每月的工作。我升级到Mysql 5.7(从5.1或5.2之类的版本),因为最初的安装是32位的,所以我无法将innodb缓冲池的大小提高到该数据库所需的最小10gb(我在具有以下功能的计算机上将其设置为16GB): 32GB RAM。一个月后,我现在去运行此查询,但它在6个

  • 我有一个名为“Prices”的MongoDB集合,我试图查询“startDate”和“endDate”之间的价格。 该集合每10秒存储一次价格,但是当查询此集合以绘制图形时,每1-2分钟的价格才是真正重要的。 我尝试用两种不同的方式编写此查询: 方法1:使用{$gte:startDate,$lte:endDate} 此方法引发以下错误: 如果删除排序('-timestamp')行,并再次运行此查询

  • 问题内容: 如何按日期降序对django中的查询集进行排序? 我只想从所有的check_in日期按降序过滤。 问题答案: 注意之前。 Django说明文件