课程信息 ·教材:《实用多元统计分析》R.A.Johnson and D.W.Wichern 著,清华大学出版社,2008第6版.(英文版和中文版) ·参考教材: An Introduction to Multivariate Statistical Analysis,2003(3rd). T.W.Anderson,Wiely. Applied Multivariate Statistical Analysis,2011(3rd ed), W.K.Hardle,L.Simar,Springer. -Exploratory Multivariate Analysis by Example Using R.2017,Francois Husson,Sebastien Le,Jerome Pages, Chapman and Hall/CRC. 一实用多元统计分析,方开泰,华东师范大学出版社 Previous Next First Last Back Forward 1
课程信息 • 教材:《实用多元统计分析》R.A. Johnson and D.W. Wichern 著, 清华大学出版社, 2008 第 6 版. (英文版和中文版) • 参考教材: – An Introduction to Multivariate Statistical Analysis, 2003(3rd), T.W.Anderson, Wiely. – Applied Multivariate Statistical Analysis, 2011(3rd ed), W. K. Härdle, L. Simar, Springer. – Exploratory Multivariate Analysis by Example Using R, 2017, Francois Husson, Sebastien Le, Jérôme Pagès, Chapman and Hall/CRC. – 实用多元统计分析, 方开泰, 华东师范大学出版社. Previous Next First Last Back Forward 1
一应用多元统计分析,高慧璇,北京大学出版社 ·成绩评定:20/100作业和15/100上机作业,45/100期中考试, 20/100期末project 。课程内容结构: 线性代数 1-4章 统计推断 协方差结构分析 分炎和判别 5-7章 8-10童 11-12章 多元正态分布 主成分分析、 线性分类, 因子分析 聚类分析、 多维标度法等 机器学习,课程主要内容 Previous Next First Last Back Forward 2
– 应用多元统计分析, 高慧璇, 北京大学出版社 • 成绩评定: 20/100 作业和 15/100 上机作业, 45/100 期中考试, 20/100 期末 project • 课程内容结构: Previous Next First Last Back Forward 2
1.1 简介 ·多元数据:许多观测或者设计研究中,每个试验单元()的多 个指标(p)被同时观测收集 Xi=(Xi,...,Xip),i=1,...:n 。多元分析是一类运用线性代数知识,分析处理多元数据的统计 方法或机器学习/人工智能方法, ·相比于一元分析,多元分析利用多个变量之间的潜在相关性来 提升推断效率 ,一些多元数据分析技术基于特定的概率模型,特别是多元正态分布, 其他不依赖于特定分布的方法称为“模型自由的”(model-ree) Previous Next First Last Back Forward 3
1.1 简介 • 多元数据: 许多观测或者设计研究中, 每个试验单元 (n) 的多 个指标 (p) 被同时观测收集 Xi = (Xi1, . . . , Xip), i = 1, . . . , n • 多元分析是一类运用线性代数知识,分析处理多元数据的统计 方法或机器学习/人工智能方法. • 相比于一元分析,多元分析利用多个变量之间的潜在相关性来 提升推断效率 • 一些多元数据分析技术基于特定的概率模型, 特别是多元正态分布, 其他不依赖于特定分布的方法称为 “模型自由的” (model-free) Previous Next First Last Back Forward 3
数据的组织 ·n个观测,p个变量(表示为数据矩阵) 变量1 变量2 变量p Item 1 Obs 1 E11 E12 4 Tip Item 2 Obs 2 T21 T22 4 工2P .. Item n Obs n Inl 工n2 Enp x秋:第i个个体的第k个变量值. 常用矩阵表示 E11 E12 士1p 工21 E22 烟 X= 工2P or X= In1 In2 np x Previous Next First Last Back Forward 4
数据的组织 • n 个观测, p 个变量:(表示为数据矩阵) 变量 1 变量 2 · · · 变量 p Item 1 Obs 1 x11 x12 · · · x1p Item 2 Obs 2 x21 x22 · · · x2p . . . . . . . . . . . . . . . Item n Obs n xn1 xn2 · · · xnp xik : 第 i 个个体的第 k 个变量值. 常用矩阵表示 X = x11 x12 · · · x1p x21 x22 · · · x2p . . . . . . . . . . . . xn1 xn2 · · · xnp or X = x T 1 x T 2 . . . x T n Previous Next First Last Back Forward 4
数据的特点 ·测量的类型 -名义尺度(Nominal):类别变量,顺序没有意义.例如性 别,颜色 -有序尺度(Ordinal):类别变量,顺序有意义.例如等级 -区间尺度(Interval):数值的差有意义,没有固定的0位 置.例如温度,海拔,纪年 -比例尺度(Ratio):数值变量,比值是有意义的,具有固定 的0值位置.例如高度,年龄,体重等。 根据数据的测量类型选择合适的统计方法 Previous Next First Last Back Forward 5
数据的特点 • 测量的类型 – 名义尺度 (Nominal): 类别变量, 顺序没有意义. 例如性 别, 颜色 – 有序尺度 (Ordinal): 类别变量, 顺序有意义. 例如等级 – 区间尺度 (Interval): 数值的差有意义, 没有固定的 0 位 置. 例如温度, 海拔, 纪年 – 比例尺度 (Ratio): 数值变量, 比值是有意义的, 具有固定 的 0 值位置. 例如高度, 年龄, 体重等. 根据数据的测量类型选择合适的统计方法 Previous Next First Last Back Forward 5