数理统计部分
数理统计部分 1
主要内容 2 试验设计:研究如何 Producing Data 有效地收集随机数据 Exploratory Data Analysi 统计推断 Population 研究如何有 效分析已获 Data 得的随机数 Inference 据 Probability 从 population中得到 data data进行分析根据a的结果对 population 下结论( inference)
2 从population中得到data 对data进行分析 根据data的结果对 population下结论(inference) 试验设计:研究如何 有效地收集随机数据 统计推断: 研究如何有 效分析已获 得的随机数 据 主要内容
关于试验设计 1936年罗斯福( Roosevelt)任总统第一任期满,共和党候选人兰 登( Landon).绝大多数观察家认为罗斯福会不费力获胜.“文学摘 要”自1916年以来历届总统选举中,都正确地预测获胜者,这次根 据240万人的民意测验预测兰登会以57%对43%获胜.但是,最后罗斯 福以62%对38%获胜.此后不久“文学摘要”就垮台了 尽管样本足够大但“文学摘要”预测误差大的惊人,盖洛普(Glup)刚 刚成立调查机构,他在“文学摘要”之前,仅用3000人的样本,以一个百 分点的误差预言了“文学摘要”的结果.另外利用来源不同的5万人的 样本,正确地预测罗斯福获胜.盖洛普预测56%赞成罗斯福,误差=62% -56%=6%
关于试验设计 3
关于试验设计 “文学摘要”的差错在哪? (1)选择偏德他们抽取样本的程序:将问卷邮寄给1千万人,这1千 万人的名单和地址来自电话簿和俱乐部名册.这导致筛掉不属于俱 乐部和没有电话的穷人(当时1/4的家庭有电话).因此,有选择偏差 1936年,绝大多数穷人投罗斯福的票,而富人投兰登的票 (2)不回答偏倚不回答者可能非常不同于回答者,“文学摘要”收 到1千万人中的240万人的回答.调查得知:低收入和高收入的人倾向 不回答,中等收入阶层的回答居多 现代调查机构更喜欢采用亲自询问代替邮寄问卷.亲自询问的典 型回答率是65%,而邮寄的典型回答率是25%
关于试验设计 4
统计量与抽样分布
统计量与抽样分布 6