显然,在多组分类资料中只有列和O在分类前未知, 行和O.在分类前已由各总体之样本容量给出。交叉分类 资料与多组分类资料的意义虽然不同,但其调查频数表 的结构形式完全相同。都为列联表。根据两者的分类特 点,交叉分类资料检验的是两种属性是否独立;而多组 分类资料需要判断的是各个总体按同一属性Y的类的分布 概率是否都相同 设列联表所给资料是多组分类资料,以X;代表第i个 总体,则从第个总体中抽取的个体属Y类的概率为 P(Y=y1|X=x)=p1;i=1,2…,r;j=1,2,…,c 这样,对多组分类资料各总体按属性Y的类的分布概率相 同性检验的假设为 H:=P12=…=B=P1(=12…);H1:H不成立 在H成立下,即各总体之个体属Y类的概率均为p;,因 而可利用列联表第例列的实测数据估计,即 P=(O1+O21+…+O)n=O/n (4)
显然,在多组分类资料中只有列和O•j在分类前未知, 行和Oi• 在分类前已由各总体之样本容量给出。交叉分类 资料与多组分类资料的意义虽然不同,但其调查频数表 的结构形式完全相同。都为列联表。根据两者的分类特 点,交叉分类资料检验的是两种属性是否独立;而 多组 分类资料需要判断的是各个总体按同一属性Y的类的分布 概率是否都相同。 设列联表所给资料是多组分类资料, 以Xi 代表第i个 总体,则从第i个总体中抽取的个体属Yj 类的概率为 P(Y=yj∣X=xi )=pj∣i i=1,2,…,r ; j=1,2,…,c 这样,对多组分类资料各总体按属性Y的类的分布概率相 同性检验的假设为 H0 : pj∣1=pj∣2=…=pj∣r=pj (j=1,2,…,c) ; H1 : H0不成立 在H0成立下,即各总体之个体属Yj类的概率均为pj,因 而可利用列联表第j列的实测数据估计,即 p O O O n O n (4) j j j r j j ˆ ( )/ / = 1 + 2 ++ =
设第个总体的样本容量为O,则第个总体的个体属Y 类的理论频数近似有 En=0,p1=0O,/ni=1,2,…r;j=1,2,…,c (5) 可见,虽然交叉分类资料两属性的独立性检验与多组分 类资料分布概率的相同性检验在意义上不相同,但是, 两者的理论频数的计算公式(2)与(5)完全一样,因 此,检验统计量仍为(3)式。 而且,由于∑O=n,∑P=1,故x2分布 的自由度=1 仍为df=r×c-(r+c-2)-1=(r-1)(c-1)。这样,多组分类资料 分布概率的相同性检验与交叉分类资料两属性的独立性 检验的操作相同
设第i个总体的样本容量为Oi• ,则第i个总体的个体属Yj 类的理论频数近似有 (5) 可见,虽然交叉分类资料两属性的独立性检验与多组分 类资料分布概率的相同性检验在意义上不相同,但是, 两者的理论频数的计算公式(2)与(5)完全一样,因 此,检验统计量仍为(3)式。 而且,由于 ,故 分布 的自由度 仍为df=r ×c-(r+c-2)-1=(r-1)(c-1)。这样,多组分类资料 分布概率的相同性检验与交叉分类资料两属性的独立性 检验的操作相同。 E O p O O n i r j c i j i j i j = ˆ = / =1,2, ; =1,2, , = = = = c j j r i Oi n p 1 1 , 1 2