问题：

如何估计Windows Azure表存储查询性能？

武功

2023-03-14

我想评估一下我的Windows Azure表存储查询是如何缩放的。为此，我建立了一个简单的测试环境，在这个环境中，我可以增加表中的数据量，并测量查询的执行时间。基于时间，我想定义一个成本函数，它可以用来评估未来查询的性能。

我评估了以下查询：

使用PartitionKey和RowKey查询
使用PartitionKey和属性进行查询
使用PartitionKey和两个行键进行查询
带有PartitionKey和两个属性的查询

对于最后两个查询，我检查了以下两种模式：

PartitionKey==“...”&&(RowKey==“...”RowKey==“...”）
（PartitionKey==“...”&&RowKey==“...”）（PartitionKey==“...”&&RowKey==“...”）

为了最小化传输延迟，我在一个Azure实例上执行了测试。从测量结果我可以看出

查询1（这并不奇怪，因为表是基于这些字段索引的）速度极快，如果表中有大约150000个条目，它大约是10-15ms。
查询2需要分区扫描，因此执行时间随存储的数据线性增加。
查询3.1的执行几乎与查询2完全相同。因此，该查询也是在执行完全分区扫描时执行的，对我来说这有点奇怪。
查询4.1比查询3.1慢两倍多一点。因此它似乎是通过两次分区扫描来评估的。
最后，查询3.2和4.2的执行速度几乎是查询2的4倍。

您能解释一下查询/筛选器解释器的内部功能吗？即使我们接受查询3.1需要分区扫描，查询4.1也可以使用相同的逻辑（在相同的时间下）进行评估。查询3.2和4.2对我来说似乎是个谜。有什么线索吗？

显然，我想在一个查询中查询不同的元素，以最小化成本，同时不损失性能。但似乎对每个元素使用单独的查询（带有任务并行库）是唯一真正快速的解决方案。这样做的公认方式是什么？

共有1个答案

宣高朗

2023-03-14

对于像3.2和4.2这样的查询，将会有一个一个的完整分区扫描以及属性。即使这些分区位于两台独立的计算机上，查询也不会并行运行，这就是为什么您会看到执行时间如此之长。这是因为Windows Azure没有对查询进行查询优化。代码的责任是以一种可以并行运行的方式编写代码。

如果您想要获得更快的性能，就不需要使用任务并行库并行运行查询以获得更高的性能。

类似资料：

提高 Azure 表存储查询性能的建议

我们在Azure Table Storage中有一个表，自从新实现以来，它目前有50，000个条目。 PartitionKey:字符串形式的日期时间值< br> RowKey:字符串形式的数值我们使用生成筛选条件。PartitionKey filter是这样的：
如何查询存储在azure WADMETRICS表中的度量？

使用扩展度量，我试图检索特定VM的特定度量。每个查询似乎花费的时间都非常长，因为表中每隔15秒就会为每个VM创建新的记录。所以我试图在最后5分钟内查询该表，但它不起作用，并给我一个错误。有人知道如何查询这些WADMETRICS表吗？
如何估算SQL查询时间？

问题内容：我正在尝试估算以下查询可能花费的时间：问题答案：使用SHOW PROFILES语法可以做到这一点。打开MySQL会话时，可以将变量“分析”设置为1或ON。因此，所有发送到服务器的语句将被分析并存储在历史记录中，并在以后通过键入以下命令显示：从MySQL手册中可以看到：参考文献（在更新日期：2014年9月4日）： - SHOW PROFILE语法 - INFORMATION_S
查询表和表中存储的列名

问题内容：我之所以来到这里，是因为我在Oracle数据库中没有足够的经验来解决这个问题。让我解释：桌子我有一个表，我们会打电话给属性，包含3列： ID ，属性的ID， -edit：ENTITY_ID为好，它是指/编辑-实体， TABLE_NAME ，包含表的名称，其中的存储该属性的值，以及 Column_name ，其中包含该表中存储该值的列的名称。在 Table_name 列中引用
使用Rest Api查询Azure表存储

我试图使用rest API从azure数据表中检索数据。 Api错误已输出，数据无效。如果我同时添加RowKey和PartitionKey，就像下面这样。它起作用了。是否需要通过行键？如果我只想从一个分区检索所有数据。我知道，我们可以在查询参数中添加一个$filter，但这不会导致性能问题吗？请分享你的想法。谢谢！
查询Jena TDB存储

如何估计Windows Azure表存储查询性能？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档