以PC1、PC2为坐标轴,描点,我们通常主要关注PC1,PC2取值降维可极端的点,考察它们的特点(这里指地理位置信息),视化/PC散点图pc=mypcasx#主成分矩阵ypC=pc[,1:2]#前两个主成分PC1,PC2)plot(pc,pch=2)#PC1-PC2散点图(下页的图)area=temperaturel,"Area"lcolor=as.numeric(factor(area)text(pc+0.2,rownames(temperature),col=color)#标记城市名称和area(四种颜色)99KievBudapestMinskPC1代表南北/纬度/年度平均气温:AthensSopiagueKngkowMadridOslbelsinki北欧/东欧与南欧城市处于PC1轴的两evoRomeBerinStockholm端,差别较大,而西欧介于中间,温TOdnhaoenPanis度适宜。温BTASSerdamLsbon差PC2代表东西/经度:EastNorthDibin东欧城市的PC2较大,这些城市地理位SoutthReyiWest置靠东,温度变化大。单斯本、都柏-202-6林、雷克雅未克、伦敦的PC2较小,这平均气温PC1些城市靠西,温度变化小。四个区域的特点:西欧的PC1和PC2适中(温差小,气候西欧温和(PC1,PC2在中心位置):温和),事实上,西欧并不太靠西。东欧寒冷、温差大;北欧寒冷、温差小;南欧热,温差小11
11 pc=mypca$x #主成分矩阵Y pc=pc[,1:2] #前两个主成分PC1,PC2 ) plot(pc, pch=2) #PC1-PC2散点图(下页的图) area=temperature[,"Area"] color=as.numeric(factor(area)) text(pc+0.2, rownames(temperature),col=color) #标记城市名称和area(四种颜色) 降维可 视化/PC 散点图 以PC1、PC2为坐标轴,描点,我们通常主要关注PC1,PC2取值 极端的点,考察它们的特点(这里指地理位置信息). PC1代表南北/纬度/年度平均气温: 北欧/东欧与南欧城市处于PC1轴的两 端,差别较大,而西欧介于中间,温 度适宜。 PC2代表东西/经度: 东欧城市的PC2较大,这些城市地理位 置靠东,温度变化大。里斯本、都柏 林、雷克雅未克、伦敦的PC2较小,这 些城市靠西,温度变化小。 西欧的PC1和PC2适中(温差小,气候 温和),事实上,西欧并不太靠西。 四个区域的特点: 西欧温和(PC1,PC2 在中心位置); 东欧寒冷、温差大; 北欧寒冷、温差小; 南欧热,温差小 平均气温 温 差
为了与通常的地理方位概念相符,我们互换PC1轴和PC2轴(左图),可以看到,PC2-PC1散点图(温度分布图)基本与地理位置基本(右图)一致。但也有不同的地方,比如萨拉热窝,雷克雅未克温度特征与地理特征不同18ReykjavikBevuMeisinkMoaMinskSaocke8Oslo StockholmHeisinkiKieno0eKrakowMoscow5CopenhagenADublinABenlguninpgonAAng/aLsMinskLonAmsferbanBerlin8ParisBudapestBrusseisKievPragueKrakowaParisBudapestSadicEasSarejevoSofaNorthshoRomeSoutMadridWesLisbonAth20.100103040-2经度总结:通过主成分分析,我们知道:PC1大致为平均气温,代表南北:PC2大致为温差,代表东西。还有一些问题可以考虑:样本与变量的联系:特定城市的温度在哪些月份(变量)上取值较大?。PC1,PC2与各个月份温度有什么关系?哪些月份温度类似?下面我们考虑在Pc散点图上添加变量信息,即双标图biplot。12
12 为了与通常的地理方位概念相符,我们互换PC1轴和PC2轴(左图),可以看 到, PC2-PC1散点图(温度分布图)基本与地理位置基本(右图)一致。但也 有不同的地方,比如萨拉热窝,雷克雅未克温度特征与地理特征不同 总结:通过主成分分析,我们知道: PC1大致为平均气温,代表南北;PC2大致为温差,代表东西。 还有一些问题可以考虑: • 样本与变量的联系:特定城市的温度在哪些月份(变量)上取值较大? • PC1,PC2 与各个月份温度有什么关系?哪些月份温度类似? 下面我们考虑在PC散点图上添加变量信息,即双标图biplot