概率论与数理统计讲义 数理统计部分 张伟平 2007 Fall
V«ÿÜÍn⁄O˘¬ ——Ín⁄O‹© ‹ï² 2007 Fall
目录 第一章基本概念 1.1引言 1 1.2基本概念 3 1.2.1总体(Population),样本(Sample) 4 1.2.2统计量(Statistic) 6 1.3收集和加工有用的数据* 8 1.3.1数据的有效性.. 8 1.3.2充分统计量··· 8 1.3.3对数据作预处理 10 1.4统计三大分布...... 10 1.4.1X2,t,F分布··· 10 1.4.2 正态总体下京与S2的分布 12 1.5总结 14 参考文献 15 i
8¹ 1òŸ ƒVg 1 1.1 ⁄Û . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 ƒVg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.1 oN(Population), (Sample) . . . . . . . . . . . . . . . . . . 4 1.2.2 ⁄O˛(Statistic) . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 ¬8⁄\Ûk^Í‚* . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.1 Í‚k5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.2 ø©⁄O˛ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3.3 ÈÍ‚ä˝?n . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.4 ⁄On婟 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.4.1 χ 2 , t, F©Ÿ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.4.2 oNeX¯ÜS 2©Ÿ . . . . . . . . . . . . . . . . . . . . . . 12 1.5 o( . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Ωz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 i
Statistics is itself a sciencethe science of learning from data. -From Statistics:Challenges and Opportunities for the Twenty-First Century We are drowing in information and starving for knowledge. —Rutherford D.Roger iⅱ
Statistics is itself a science—– the science of learning from data. ——From Statistics: Challenges and Opportunities for the Twenty-First Century We are drowing in information and starving for knowledge. ——Rutherford D. Roger ii
第一章 基本概念 数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分 析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策 和行动提供依据和建议, 数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资 料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲, 只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出 来.但客观情况只允许我们对随机现象进行次数不多的观察试验,也就是说,我们获得 的只是局部观察资料. 数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对 所研究的问题,尽可能地作出精确而可靠的结论, 1.1 引言 1.1.Who Are Those Speedy Drivers? 在Penn.State University作了一个调查,被调查者要回答他们开车的最大速度? 随机采访了87位男士和102位女士,得到数据如下:(单位:mp) male 1101099014010515012011011090115951451401101058595100 11512495100125140851201151051251028512011012011594125 80851401209213012511090110110959511010580100110130 10512090100105100120100100801001201056012512010011595 110101801121201101151255590105 female 8075838010010090759585908590901208510012075 85807085110857510595757090708285100907590 11080801101109575130951101108090105901107510090 1
1òŸ ƒVg Ín⁄OÆ¥òÄA^5ÈrÆâ. ߥԃN±kꙬ8!n⁄© ¤ëkëÅ5͂߱Bȧ ØKä—̉⁄˝ˇßÜñèÊò½˚¸ ⁄1ƒJ¯ù‚⁄ÔÆ. Ín⁄Oÿ”uòÑ]⁄Oßßç˝uA^ëÅyñ5Æ5?1] ¬8!n⁄©¤. duå˛ëÅyñ7,•y—ß5Æ5ßœ lnÿ˛˘ß êáÈëÅyñ?1v ıg* ßÔƒëÅyñ5Æ5ò½UòŸ/•y— 5. ê*ú¹ê#N·ÇÈëÅyñ?1gÍÿı* £ßè“¥`, ·Çº ꥤ‹* ]. Ín⁄O?÷“¥ÔƒNk/¬8!n!©¤§ºkÅ]ßÈ §ÔƒØK, ¶åU/ä—°( åÇ(ÿ. 1.1 ⁄Û ~1.1. Who Are Those Speedy Drivers? 3Penn. State University ä òáNßNˆá£â¶ÇmêÅåÑ›º ëÅÊñ 87†I¨⁄102†Â¨ßÍ‚Xeµ(¸†: mph) > male 110 109 90 140 105 150 120 110 110 90 115 95 145 140 110 105 85 95 100 115 124 95 100 125 140 85 120 115 105 125 102 85 120 110 120 115 94 125 80 85 140 120 92 130 125 110 90 110 110 95 95 110 105 80 100 110 130 105 120 90 100 105 100 120 100 100 80 100 120 105 60 125 120 100 115 95 110 101 80 112 120 110 115 125 55 90 105 > female 80 75 83 80 100 100 90 75 95 85 90 85 90 90 120 85 100 120 75 85 80 70 85 110 85 75 105 95 75 70 90 70 82 85 100 90 75 90 110 80 80 110 110 95 75 130 95 110 110 80 90 105 90 110 75 100 90 1
110859080808550809010080808095100901009580 805088909085709030858587859085759010280 1008095908095110 从这些数据中我们能了解到什么呢?男士和女士开车最快速度有什么特点? 简单的数据总结得到 male Female Min.: 55.0 30.0 1st Qu.: 95.0 80.0 Median 110.0 89.0 Mean 107.4 88.4 3rdQu.:120.0 95.0 Max. 150.0 130.0 显然,有一半的男士开车的最快速度>110,有3/4的人最快速度>95,而开车最快 的速度为150,最慢的速度为55.对女士而言,有一半的人开车的最快速度≥89,有3/4的 人的最快速度≥80,而开车最快的速度为130,最慢的速度为30. 进一一步,我们还以对这些数据的分布有如下了解 从这些分析我们可以认为男性开车速度数据是服从某个正态分布的。 例1.2.在卢瑟福试验中,每隔一段时间观察一次由某种铀所放射的到达计数器的粒子 数,共观察100次,得到结果如下: i01234567891011≥12 15161726119921210 其中;表示观察到i个粒子的次数。由理论知识认为放射粒子数服从Poisse0n分布,试问 是否真是这样? 例1和例2反映了统计的两个方面:描述性统计(Descriptive Statistics)和推断性统 计(Inferential Statistics)。 像例1那样对数据的特点(中心、方差、分位数、直方图等等)进行描述或者总结的 方法,我们称为描述性统计。而像例2那样,利用观察到的(部分)数据对总体作出某种 2
110 85 90 80 80 85 50 80 90 100 80 80 80 95 100 90 100 95 80 80 50 88 90 90 85 70 90 30 85 85 87 85 90 85 75 90 102 80 100 80 95 90 80 95 110 l˘ Í‚•·ÇU )üoQ? I¨⁄¨mêÅØÑ›küoA:º {¸Í‚o( male Female Min. : 55.0 30.0 1st Qu.: 95.0 80.0 Median : 110.0 89.0 Mean : 107.4 88.4 3rd Qu.: 120.0 95.0 Max. : 150.0 130.0 w,, kòåI¨mêÅØÑ›≥110, k3/4 <ÅØÑ›≥ 95, mêÅØ Ñ›è150, Å˙Ñ›è55. Ȩ Û, kòå<mêÅØÑ›≥89, k3/4 <ÅØÑ›≥ 80, mêÅØÑ›è130,Å˙Ñ›è30. ?ò⁄ß·ÇÑ±È˘ Í‚©ŸkXe ) l˘ ©¤·Çå±@èI5mêћ͂¥—l,᩟" ~1.2. 3©Ÿ4£•,zÖò„ûm* ògd,´f§òàOÍÏ‚f Í, * 100g, (JXe: i 0 1 2 3 4 5 6 7 8 9 10 11 ≥ 12 vi 1 5 16 17 26 11 9 9 2 1 2 1 0 Ÿ•viL´* iá‚fgÍ"dnÿ£@èò‚fÍ—lPoisson©Ÿß£Ø ¥ƒ˝¥˘º ~1⁄~2áN ⁄O¸áê°µ£„5⁄O(Descriptive Statistics) ⁄̉5⁄ O(Inferential Statistics )" î~1@ÈÍ‚A:(•%!ê!©†Í!Üê„)?1£„½ˆo( ê{߷ǰ裄5⁄O" î~2 @ß|^* (‹©)Í‚ÈoNä—,´ 2