夹角余弦 W:x cOS ∑x1∑x Xi1, x 2 9 x )a j(xj1,xj2,…,xjm 0(0,0,…,0)
夹角余弦 O(0,0,…,0) Xi(xi 1,xi2 ,…,xim ) Xj(xj1 ,xj2 ,…,xjm ) A = = = = m j m i m i j i j x x x x 1 2 1 2 1 cos
相关系数 Ja C Ia ∠(xl-x 当数据标准化以后S,=cos
相关系数 = = = − − − − = m j j m i i m i i j j i j x x x x x x x x S 1 2 1 2 1 ( ) ( ) ( )( ) Sij ij 当数据标准化以后 = cos
1.3类间距离 o最近邻居d=d1 o组间平均锁链c(1+d2/2·9 o最远邻居d=d2 o组内平均锁链d=(d1+d2+d3)/3 o重心距离 o离差平方和法
1.3 类间距离 最近邻居d=d1 最远邻居d=d2 组间平均锁链d=(d1+d2)/2 组内平均锁链d=(d1+d2+d3)/3 重心距离 离差平方和法 d1 d2 d3
14数据标准化经费以“元”经费以“万元 o变量存在数量级上的差异 高校科研的三个样本 校科研的两两距离矩阵 学校样本的欧氏距离 学科研投入经费课题 校人数(元)数 (人) (项) 万元 1410438000019 1-2265000 82 2336173000021 1-3218000 194 34902200008 2-3(470001255
1.4 数据标准化 变量存在数量级上的差异 学 校 科研 人数 (人) 投入经费 (元) 课题 数 (项) 1 410 4380000 19 2 336 1730000 21 3 490 220000 8 高校科研的三个样本 三高校科研的两两距离矩阵 学校 样本的欧氏距离 元 万元 1-2 265000 82 1-3 218000 194 2-3 47000 255 经费以“元”计经费以“万元”计
标准化方法 o标准差的标准化 o假定有n个样本,m个变量,则可以建立 个原始数据矩阵X 12 21 x 2 2 nmn×m
标准化方法 标准差的标准化 假定有n个样本,m个变量,则可以建立一 个原始数据矩阵X [ , , , ] 1 2 1 2 2 1 2 2 2 1 1 1 2 1 m n n n m n m m m x x x x x x x x x x x x X = =