4-2)双变量关系强度测量的主要指标 定类 定序 定距 定类 卡方类测量卡方类测量Eta系数 定序 Spearman Spearman相 相关系数关系数 同序-异序 对测量 定距 Pearson相关 系数 李炜制作
李炜制作 4-2) 双变量关系强度测量的主要指标 定 类 定 序 定 距 定 类 卡方类测量 卡方类测量 Eta 系 数 定 序 ⚫ Spearman 相关系数 ⚫ 同 序 - 异 序 对测量 Spearman 相 关系数 定 距 Pearson 相 关 系 数
4-3)卡方测量的原理: 卡方测量用来考察两变量是否独立(无关) 其原理是根据这一概率定理:若两变量无关,则 两变量中联合事件发生的概率应等于各自独立发 生的概率乘积。 P.=B×P 在列联表中,这一定理就具体转化为:若两变量无 关,则两变量中条件概率应等于各自边缘的概率乘 积。反之,则两变量有关,或,两变量不独立。 李炜制作
李炜制作 4-3)卡方测量的原理: 卡方测量用来考察两变量是否独立(无关)。 其原理是根据这一概率定理:若两变量无关,则 两变量中联合事件发生的概率应等于各自独立发 生的概率乘积。 Pij = Pi. P. j 在列联表中,这一定理就具体转化为:若两变量无 关,则两变量中条件概率应等于各自边缘的概率乘 积。反之,则两变量有关,或,两变量不独立
示例 患肺癌未患肺癌 边缘概率 观察值 15 15 吸烟 24 30% 期望条件 概率 65 不吸烟 56 70 9 边缘概率 20 80% 100% 残差 李炜制作
李炜制作 示例 患肺癌 未患肺癌 吸烟 6 24 30% 不吸烟 14 56 70% 20% 80% 100% 15 15 5 65 观察值 边缘概率 边缘概率 期望条件 概率 9 -9 9 -9 残差
由此可见,期望值(独立模型)与观察值 的差距越大,说明两变量越不独立,也就 越有相关。因此,卡方的表达式如下: O X2=∑∑ Ei) E 卡方的取值在0~∞之间。卡方值越大,关 联性越强。在SPSS中,有 Pearson X2和相 似比卡方( Likelihood ratioⅩ2)两种。 李炜制作
李炜制作 由此可见,期望值(独立模型)与观察值 的差距越大,说明两变量越不独立,也就 越有相关。因此,卡方的表达式如下: 卡方的取值在0~∞之间。卡方值越大,关 联性越强。在SPSS中,有Pearson X2和相 似比卡方(Likelihood Ratio X2 )两种。 − = j i ij ij ij E O E X 2 2 ( )
4-4)的改进标准化系数: 为使2值有一固定的区间,便于比较, 米用了以下几个修正: A、Q系数(Ph):(0~1),适用于2×2表。 B、列联系数( Contingency Coefficient): (0-1),适用任意表。 C、 Cramer V系数:(0~1),适用任意表。 D、λ系数( Lambda):(0~1),适用任意表 E、 Goodman& Kruskal-tau系数:(0~1),适用任 意表 李炜制作
李炜制作 4-4) 的改进标准化系数: 为使 值有一固定的区间,便于比较, 采用了以下几个修正: 2 X 2 X A、φ系数(Phi): (0~1), 适用于2×2表。 B、 列联系数(Contingency Coefficient): (0~1),适用任意表。 C、 Cramer V系数:(0~1),适用任意表。 D、λ系数(Lambda): (0~1),适用任意表。 E、 Goodman & Kruskal-tau系数: (0~1),适用任 意表