第二节参数估计与假设检验Bioinformatics统计推断=参数估计+假设检验(x1x2...xn)~f比如:100只同样品种小鼠的基因A的表达量假设检验X1+x2+."+Xn该品种小鼠的基因A高表达?xIbn单样本检验:t-test,z-test,Wilcox符合秩检验,Wilcox符合秩和检验已知VmXO一叫)/o服从标准正态分布,故P(-Z1-α/2 < Vn(XO-μ)/g< Z1-α/2) - α,置信区间(confidenceinterval)是在给定的置信水平一α下,基于样本统计量构造的总体参数的一10种区间估计
Bioinformatics 第二节 参数估计与假设检验 统计推断 = 参数估计+ 假设检验 𝑥1 𝑥2 . 𝑥𝑛 ~ 𝑓 比如:100只同样品种小鼠的基因A的表达量 𝑥ҧ 𝑥1 + 𝑥2 + ⋯ +𝑥𝑛 该品种小鼠的基因A高表达? 𝑛 假设检验 单样本检验:t-test, z-test, Wilcox 符合秩检验, Wilcox 符合秩和检验 已知 𝑛(𝑋ത− 𝜇)/𝜎服从标准正态分布,故 𝑃(−𝑍1−𝛼/2 < 𝑛(𝑋ത− 𝜇)/𝜎 < 𝑍1−𝛼/2) − 𝛼, 置信区间(confidence interval)是在给定的置信水平 − 𝛼下,基于样本统计量构造的总体参数的一 种区间估计。 10
第二节参数估计与假设检验Bioinformatics统计推断=参数估计+假设检验(x1 x2... xn)~f比如:100只同样品种小鼠的基因A的表达量假设检验X1+x2+..+xn该品种小鼠的基因A高表达?xIbn单样本检验:t-test,z-test.Wilcox符号秩检验已知VmXO一u)/α服从标准正态分布,故a/2a/2KVP(-Z1-α/2 <n(xrO-μ)/g<Z1-α/2) -α,拒地址置信区间鉅绝域置信区间(confidenceinterval)是在给定的置信水平一α下,基于样本统计量构造的总体参数的一11种区间估计
Bioinformatics 第二节 参数估计与假设检验 统计推断 = 参数估计+ 假设检验 𝑥1 𝑥2 . 𝑥𝑛 ~ 𝑓 比如:100只同样品种小鼠的基因A的表达量 𝑥ҧ 𝑥1 + 𝑥2 + ⋯ +𝑥𝑛 该品种小鼠的基因A高表达? 𝑛 假设检验 单样本检验:t-test, z-test, Wilcox 符号秩检验 已知 𝑛(𝑋ത− 𝜇)/𝜎服从标准正态分布,故 𝑃(−𝑍1−𝛼/2 < 𝑛(𝑋ത− 𝜇)/𝜎 < 𝑍1−𝛼/2) − 𝛼, 置信区间(confidence interval)是在给定的置信水平 − 𝛼下,基于样本统计量构造的总体参数的一 种区间估计。 11
第二节参数估计与假设检验Bioinformatics统计推断=参数估计+假设检验X1+x2+...+xnxIh(x1 x2 ... xn}~ fn100只品种1的基因A表达量Yi+y2+.+yn(y1 y2 ... ynj~ g100只品种2的基因A表达量y0)n统计量假设检验xb -y0)品种1的表达量高于品种2的表达量?双样本均值检验:双t-test,z-test,Wilcox秩和检验配对检验:配对t-test,配对z-test,Wilcox符号秩检验12
Bioinformatics 第二节 参数估计与假设检验 统计推断 = 参数估计+ 假设检验 𝑥1 + 𝑥2 + ⋯ +𝑥𝑛 𝑥ҧ 𝑥1 𝑥2 . 𝑥𝑛 ~ 𝑓 100只品种1的基因A表达量 𝑛 𝑥ҧ − 𝑦ത 品种1的表达量高于品种2的表达量? 假设检验 100只品种2的基因A表达量 𝑦1 + 𝑦2 + ⋯ + 𝑦𝑛 𝑦ത 12 𝑛 y1 𝑦2 . 𝑦𝑛 ~ 𝑔 统计量 双样本均值检验:双 t-test, z-test, Wilcox 秩和检验 配对检验:配对t-test,配对z-test,Wilcox 符号秩检验
第二节参数估计与假设检验Bioinformatics统计假设检验中的错误原假设错误原假设确拒绝原假设拒真(Typelerror)Power接受原假设纳假(Typell error)统计假设检验的思想是在控制第一类错误的前提下,第二类错误越低越好统计量T,拒绝域Co.在H下,P(T E Co)≤ α13
Bioinformatics 第二节 参数估计与假设检验 统计假设检验中的错误 原假设 确 原假设错误 拒绝原假设 拒真 (Type I error) Power 接受原假设 纳假 (Type II error) 统计假设检验的思想是在控制第一类错误的前提下,第二类错误越低越好。 统计量T, 拒绝域C0, 在 H0下,𝑷 𝑻 ∈ 𝑪𝟎 ≤ 𝜶 / / 13
第二节参数估计与假设检验Bioinformatics多重假设检验矫正Hois trueTotalHoisfalse (Hiistrue)VsRRejectHo(Test isdeclared significant)UTm-RFailtorejectHo(Testisdeclarednon-significant)Totalmmom-moVVFWER- D(=EFDR=Emax[R, 1]max(1, V + S]Bonferroni矫正BH矫正FDR和FWER是两种不同的统计学概念,不能够直接比较14
Bioinformatics 第二节 参数估计与假设检验 多重假设检验矫正 FDR 和 FWER 是两种不同的统计学概念,不能够直接比较 Bonferroni 矫正 14 BH 矫正