1.3.1.2 大数据可视化常用图表
统计图表是最早的数据可视化形式之一,作为基本的可视化元素仍然被广泛的使用。对于很多复杂的大型可视化系统来说,这类图表更是作为基本的组成元素而不可或缺。同时,随着大数据可视化渲染技术的发展,涌现出很多优秀的开源图表库,例如ECharts、highcharts、LoongChart等,可制作更直观漂亮的图表。
表达内容 | 图表类型 | 描述 |
---|---|---|
项目 | 柱状图/条形图(column/Bar) | 表现多个类目数据的大小。 |
Marimekko 图 | 和堆积图类似,除了通过不同的高度来描绘数据(如在一个常规的堆积图中)之外,还通过改变列的宽度描述了数据的一个附加维度。 | |
趋势/分布 | 折线图/面积图(Line/Area) | 展现数据的发展变化趋势 |
散点图/气泡图 | 展现数据的发展变化分布 | |
主题河流 | 主题河流主要用来表示事件或主题等在一段时间内的变化。 | |
桑基图 | 桑基图是一种特殊的流图, 它主要用来表示原材料、能量等如何从初始形式经过中间过程的加工、转化到达最终形式。 | |
数量 | 瀑布图 | 表达数个特定数值之间的数量变化关系 |
组件 | 饼图/环形图 | 展示不同类目的数量在总数中所占的百分比 |
多维 | 平行坐标(Parallel Coordinates) | 常用于多维数据可视化的图表 |
关联 | 关系图 | 表现类目之间的关系 |
树状图 | 表现类目之间的关系 | |
矩形树图 | 用矩形面积的方式便于突出展现出“树”的各层级中重要的节点 | |
差异 | 误差图 | 显示数据的可变性,并用于图表以指示错误或报告的测量中的不确定性 |
多变量指标 | 雷达图(Rader Charts) | 主要用于表现多变量的数据,分析各项指标特征 |
数据分散情况 | 盒须图(Boxplot) | 显示一组数据分散情况的统计图。能显示出一组数据的最大值、最小值、中位数、及上下四分位数 |
价格变动 | K线图(Candlestick) | 指定时间段内证券或货币的价格变动 |
连续/分布 | 等值线图(Choropleth) | 等值线图使用相等数值的数据点联系来表示数据的连续分布和变化规律 |
数量 | 仪表图(guage) | 显示在现实生活中使用类似量表显示的数据 |
对于大规模数据的可视化,一些图表在直观性、真实性的表达上存在局限性,下文将列举可应用与大数据可视化中的图表。
热力图(Heatmap)
通过不同颜色区的块叠加来展示数据的分布、密度和变化趋势。如图1所示,通过热力图表现数值的大小和时间序列。图片来源:http://echarts.baidu.com/option.html#series-heatmap。
同时,热力图也可应用在地里坐标系中,用于表示数据的密度和分布情况。如图2所示,通过热力图来表达全国主要城市空气质量。图片来源:http://echarts.baidu.com/option.html#series-heatmap。
散点图(scatter plot)
不同于传统的绘制在直角坐标系中的散点图,散点图还可绘制在地理坐标系中,用于表示各地数据分布情况。如图3所示,通过散点图表示全国各地的微博签到数据。图片来源:http://echarts.baidu.com/examples/editor.html?c=scatter-weibo
平行坐标(Parallel Coordinates)
是一种常用的可视化多维数据的图表。平行坐标图将高维数据的各个变量用一系列相互平行且等距的坐标轴表示,变量值对应轴上位置。为了反映变化趋势和各个变量间相互关系,往往将描述不同变量的各点连接成折线。
图片来源:https://www.highcharts.com/docs/chart-and-series-types/parallel-coordinates-chart。
矩形树图(Treemap)
在矩形树图中,各个小矩形的面积表示每个子节点的大小,矩形面积越大,表示子节点在父节点中的占比越大,整个矩形的面积之和表示整个父节点。通过矩形树图及其钻取情况,我们可以很清晰地知道数据的全局层级结构和每个层级的详情。
图片来源:http://mbostock.github.io/d3/talk/20111018/treemap.html
力导向图(Force-Directed Graph)
是绘图的一种算法。在二维或三维空间里配置节点,节点之间用线连接,称为连线。各连线的长度几乎相等,且尽可能不相交。节点和连线都被施加了力的作用,力是根据节点和连线的相对位置计算的。根据力的作用,来计算节点和连线的运动轨迹,并不断降低它们的能量,最终达到一种能量很低的安定状态。
图片来源:https://en.wikipedia.org/wiki/Force-directed_graph_drawing
格网图(TileMap)
每个区域位置由形状相同填充、边线等区别的瓦片表示。瓦片形状可以是矩形、多边形、菱形、圆形等。用于表现数据的区域分布和聚合统计等关系。
图片来源:https://www.highcharts.com/docs/chart-and-series-types/tilemap-series。