对3维以上的数据,通过两两之间的散点图来发现变量之间的关 系,即: Scatterplot Matrix ·对高维数据集,散点图阵将所有两两变量之间的散点图以矩阵 形式排列展示 ·容易发现两两之间的关系,且只能发现两个维之间的关系,不能 发现多个数据维之间的关系.此外,数据点过多时散点图会太 过杂乱 ·关联更新(brushing and linking)技术可以应用到散点图中以 解决上述部分问题:被刷(brushed)的点在系统中所有视图中 被高亮显示,这样对比不同的视图就可以从不同的侧面来看到 数据的特征 ·在每个散点图中,不同类别(水平)的点用不同的颜色来突出显 Previous Next First Last Back Forward 11
对 3 维以上的数据, 通过两两之间的散点图来发现变量之间的关 系, 即: Scatterplot Matrix • 对高维数据集, 散点图阵将所有两两变量之间的散点图以矩阵 形式排列展示 • 容易发现两两之间的关系, 且只能发现两个维之间的关系, 不能 发现多个数据维之间的关系. 此外, 数据点过多时散点图会太 过杂乱 • 关联更新 (brushing and linking) 技术可以应用到散点图中以 解决上述部分问题: 被刷 (brushed) 的点在系统中所有视图中 被高亮显示,这样对比不同的视图就可以从不同的侧面来看到 数据的特征. • 在每个散点图中, 不同类别 (水平) 的点用不同的颜色来突出显 Previous Next First Last Back Forward 11
示 ·下图中,车辆数据按照缸体个数用不同的颜色突出显示 00 200 400 200 200 50 1 2040020 2004002000400050100150200 displayed in R via the pairs()function Previous Next First Last Back Forward 12
示 • 下图中, 车辆数据按照缸体个数用不同的颜色突出显示. displayed in R via the pairs() function Previous Next First Last Back Forward 12
Trellis Displays(Becker and Cleveland,1996) ·一类基于条件化一个或者多个变量对复杂多元数据进行可视化 的技术,常表现为一些图形构成的矩阵阵列,因此称为Tlis. ·对变量的不同水平或者不同区间下的数据集绘制相同的图形(比 如直方图,散点图等) ·许多统计软件使用trellis plots或者crossplots这样的名称来 进行多面板条件化作图 ·在R中使用lattice包来载入trellis系统.可以参考Sarkar, Deepayan (2008)Lattice:Multivariate Data Visualization with R.Springer,New York Previous Next First Last Back Forward 13
Trellis Displays(Becker and Cleveland, 1996) • 一类基于条件化一个或者多个变量对复杂多元数据进行可视化 的技术, 常表现为一些图形构成的矩阵阵列, 因此称为 Trellis. • 对变量的不同水平或者不同区间下的数据集绘制相同的图形 (比 如直方图, 散点图等) • 许多统计软件使用 trellis plots 或者 crossplots 这样的名称来 进行多面板条件化作图 • 在 R 中使用 lattice 包来载入 trellis 系统. 可以参考 Sarkar, Deepayan (2008) Lattice: Multivariate Data Visualization with R. Springer, New York. Previous Next First Last Back Forward 13
。 quakes数据集,感兴趣是 三个变量lat,long和depth 。 图形从左到右,从下到上, 深度(depth)逐渐增加 8个不同的深度区间,每个 包含约相同的地震次数 较浅的地震在两个倾斜的 断层板块上均有发生;西边 的板块主要是浅地震,而东 边的板块深浅地震都有. Previous Next First Last Back Forward 14
long lat -35 -30 -25 -20 -15 -10 165 170 175 180 185 depthgroup depthgroup 165 170 175 180 185 depthgroup depthgroup depthgroup -35 -30 -25 -20 -15 -10 depthgroup -35 -30 -25 -20 -15 -10 depthgroup 165 170 175 180 185 depthgroup • quakes 数据集, 感兴趣是 三个变量 lat,long 和 depth • 图形从左到右, 从下到上, 深度 (depth) 逐渐增加 • 8 个不同的深度区间, 每个 包含约相同的地震次数 • 较浅的地震在两个倾斜的 断层板块上均有发生; 西边 的板块主要是浅地震, 而东 边的板块深浅地震都有. Previous Next First Last Back Forward 14
Hyperslice(Jarke and Robert,1993) ·一种可视化多维标量函数的方法,本质想法是将一个多维函数 表示为一些正交二维切片(slice)图构成的矩阵 ·对p维标量函数f(x)=f(x1,,xp),记c=(c1,,cp) 为感兴趣的(当前)点,w:表示第i维的宽度,即R:=[G w:/2,C+w/2]为感兴趣的区间 ·二维切片Sk,(k≠I)为f(x),xk∈Rk,x1∈R;其他x:=c, i≠k,1的表示 一维图Gk为∫(x),xk∈Rk,且其他x:=c,i≠k的图(横 轴为xk,纵轴为f(x)的表示 ·HyperSlice图就是一个p×p矩阵图,对角为一维图G,非对 角元(k,)为二维切片图Sk,1,用相应于函数值大小的灰度值表 示函数的值 Previous Next First Last Back Forward 15
Hyperslice(Jarke and Robert, 1993) • 一种可视化多维标量函数的方法, 本质想法是将一个多维函数 表示为一些正交二维切片 (slice) 图构成的矩阵 • 对 p 维标量函数 f(x) = f(x1, . . . , xp), 记 c = (c1, . . . , cp) 为感兴趣的 (当前) 点, ωi 表示第 i 维的宽度, 即 Ri = [ci − ωi/2, ci + ωi/2] 为感兴趣的区间 • 二维切片 Sk,l(k ̸= l) 为 f(x), xk ∈ Rk, xl ∈ Rl; 其他 xi = ci, i ̸= k, l 的表示 • 一维图 Gk 为 f(x), xk ∈ Rk, 且其他 xi = ci, i ̸= k 的图 (横 轴为 xk, 纵轴为 f(x)) 的表示 • HyperSlice 图就是一个 p × p 矩阵图, 对角为一维图 Gi, 非对 角元 (k, l) 为二维切片图 Sk,l, 用相应于函数值大小的灰度值表 示函数的值 Previous Next First Last Back Forward 15