Tableau数据聚合
使用不同的聚合函数查看数值非常有用。Tableau支持许多不同的聚合类型,例如:
- 总和
- 平均
- 计数
- 唯一值
- 中位数
- 最小值
- 最大值
- 方差
- 总体方差
- 标准偏差
- 总体标准差
- 属性
- 维度
在Tableau中,您可以创建聚合维度和度量。每当向视图添加度量时,默认情况下会对这些度量应用聚合。使用的聚合类型取决于视图的上下文。
如果您不熟悉数据库,请参阅Tableau手册以获取这些聚合类型的详细定义。默认情况下将字段添加到可视化文件中,然后将显示该字段。
Tableau允许更改或更改特定视图的聚合级别。要更改默认聚合,请右键单击数据工具架内的该字段,然后通过选择菜单选项(默认属性或聚合)来更改其默认值。
还可以更改工作表中特定用途的字段的聚合。
例如:通过右键单击SUM(Sales)药丸并选择Measure(SUM)菜单选项,可以选择突出显示的任何聚合。
上图中使用的数据源是Excel电子表格的数据提取。重要的是要理解,如果依赖于与Excel的直接连接,则中位数和计数(不同)聚合将不可用。Access,Excel和文本文件不支持这些聚合类型。Tableau的提取引擎执行此任务。
1. 汇总度量
向度视图添加度量时,Tableau会自动聚合其值。平均值,总和和中值是常见的聚合函数。当前聚合看起来像视图中度量名称的一部分。
例如:Sales变为SUM(Sales),并且每个度量都有一个默认聚合,当连接到数据源时由Tableau设置。可以更改或查看度量的默认聚合。
- 可以仅使用Tableau为关系数据源聚合度量。
- 多维数据源包含已聚合的数据源。
- 在Tableau中,仅在窗口中支持多维数据源。
2. 设置度量的默认聚合
可以为任何度量设置默认聚合。它不是一个本身包含聚合的计算字段,例如AVG([Discount])。默认聚合是用于汇总离散或连续字段的首选计算。将度量自动拖动到视图时,将使用默认聚合。
要更改默认聚合
右键单击“数据”字段中的度量菜单选项,然后选择“默认属性”,然后选择“聚合”,然后选择其中一个聚合选项。
- 无法为已发布的数据源设置默认聚合。仅在最初发布数据源时设置默认聚合。
3. 如何度量数据
向视图添加度量时,会自动将聚合应用于该度量。此默认值由“分析”菜单中的“聚合度量”设置控制。
如果要在模型的最详细级别查看视图中的所有标记,可以分解视图。分解数据意味着Tableau将为数据源的每一行中的每个数据值显示单独的标记。
4. 视图中所有度量的分解
单击分析,然后转到聚合度量选项。选择“聚合度量”时,Tableau将自动尝试在视图中聚合度量。表示它将数据源中的各个行值收集到一个值中,该值会根据视图中的详细程度进行调整。
可用于度量的不同聚合确定如何收集各个值:它们可以是平均值(AVG),添加(SUM),或者设置为各个行值的最小值(MIN)或最大值(MAX)。
如果已选中,则单击聚合度量一次以取消选择。然后可以看到更改。
分解数据对于分析希望在视图中依赖和独立使用的度量非常有用。
注意:如果数据源非常巨大,那么,分解数据会导致显着性能降低。
5. 聚合维度
可以在视图中将维度聚合为最大值,最小值,计数和计数区别。汇总维度时,必须创建新的临时度量列,因此维度采用度量的特征。
注意:Count Distinct聚合不支持使用继承连接的文本文件和Microsoft Excel数据源。如果您连接到这些类型的数据源之一,则Count Distinct聚合不可用,并显示“需要提取”的注释。如果将数据源保存为数据提取,则可以使用Count Distinct聚合。
另一种将维度视为属性的方法。可以通过从维度的上下文菜单中选择“属性”来更改它。
属性聚合有几个用途:
- 它在混合多个数据源时确保一致的细节级别。
- 它提供了一种在计算表计算时聚合维度的方法,这需要聚合表达式。
- 由于本地计算,它提高了查询性能。
Tableau使用以下给定公式计算属性:
If MIN (dimension) = MAX (dimension) then MIN (dimension) else "*" end
在从初始查询中检索数据后,在Tableau中计算此给定公式。星号(*
)是当有多个值时出现特殊Null
值的可视指示符。
以上是在表计算中使用属性的示例。此表显示市场,市场规模,状态和市场销售额(SUM)(销售额)。假设想根据每个州对市场的贡献来计算总销售额的百分比。当在沿着状态计算的表计算中添加一些总计百分比时,计算将在上图所示的黑色区域内计算,因为维度的市场大小正在对数据进行分区。
将市场大小汇总为属性时,计算在市场(东)内计算,市场大小信息用作显示中的标签。