§6.2直方图和箱线图 (一)直方图 9例1下面列出了84个伊特拉斯坎(Etruscan)人男 子的头颅的最大宽度(mm),现在来画这些数据的” 频率直方图” 141148132138154142150146155158150140147148 144150149145149158143141144144126140144142 141140145135147146141136140146142137148154 137139143 140131 143 141149 148135148 152 143144 141143147146150132142142 143153149146 149 138 ●142149142137134144146147140142140137152145 17/82
17/82 §6.2 直方图和箱线图 (一)直方图 例1 下面列出了84个伊特拉斯坎(Etruscan)人男 子的头颅的最大宽度(mm),现在来画这些数据的” 频率直方图” ⚫ 141 148 132 138 154 142 150 146 155 158 150 140 147 148 ⚫ 144 150 149 145 149 158 143 141 144 144 126 140 144 142 ⚫ 141 140 145 135 147 146 141 136 140 146 142 137 148 154 ⚫ 137 139 143 140 131 143 141 149 148 135 148 152 143 144 ⚫ 141 143 147 146 150 132 142 142 143 153 149 146 149 138 ⚫ 142 149 142 137 134 144 146 147 140 142 140 137 152 145
§6.2直方图和箱线图 解这些数据杂乱无章,先要将它们进行整理。 最小值和最大值分别是126,158,即所有数据都落在区 间[126,1581上 。现取区间[124.5,159.5]能覆盖上述区间,并将[124.5, 159.5]等分为7个小区间,等分区间长度不宜过小,以免 小区间内频率为0 n较大时等分区间数k取10到20,<50时取5到6。 。小区间的长度记为4,=(159.5-124.5)/7=5。 ∠称为组距,小区间的端点称为组限。 18/82
18/82 §6.2 直方图和箱线图 解 这些数据杂乱无章,先要将它们进行整理。 ⚫ 最小值和最大值分别是126,158,即所有数据都落在区 间[126,158]上 ⚫ 现取区间[124.5,159.5]能覆盖上述区间,并将[124.5, 159.5]等分为7个小区间,等分区间长度不宜过小,以免 小区间内频率为0 n较大时等分区间数k取10到20,n<50时取5到6。 ⚫ 小区间的长度记为,=(159.5-124.5)/7=5。 称为组距,小区间的端点称为组限
§6.2直方图和箱线图 ⊙数出落在每个小区间内的数据的频数∫,算出频 率fn(n=84,-1,2,,7)如下表: 组限 频数f 频率fn 累积频率 124.5~129.5 1 0.0119 0.0119 129.5134.5 4 0.0476 0.0595 134.5139.5 10 0.1191 0.1786 139.5144.5 33 0.3929 0.5715 144.5~149.5 24 0.2857 0.8572 149.5~154.5 9 0.1071 0.9643 154.5~159.5 3 0.0357 1 19/82
19/82 §6.2 直方图和箱线图 数出落在每个小区间内的数据的频数f,算出频 率fi /n(n=84,i=1,2,…,7)如下表: 组限 频数f i 频率f i /n 累积频率 124.5~129.5 129.5~134.5 134.5~139.5 139.5~144.5 144.5~149.5 149.5~154.5 154.5~159.5 1 4 10 33 24 9 3 0.0119 0.0476 0.1191 0.3929 0.2857 0.1071 0.0357 0.0119 0.0595 0.1786 0.5715 0.8572 0.9643 1
§6.2直方图和箱线图 自左至右依次在各小区间上作以(fm)/△为高的小矩形。所 得图形叫频率直方图。这种小矩形的面积就等于数据落在 该小区间的频率fn。 由于当很大时,频率就接近于概率,因而一般来说,每 个小区间上的小矩形面积接近于概率密度曲线之下该小区 间上的曲边梯形的面积。于是,一般来说,直方图的外廓 曲线接近于总体X的概率密度曲线。 本例的直方图看起来很像来自于某一正态总体X。 。从直方图上可以直接估计X落在某一区间的概率 (fin)/ 0.095 0.071 0.048 0.024 20/82 129.5134.5139.5144.5149.5154.5159.5
20/82 §6.2 直方图和箱线图 自左至右依次在各小区间上作以(fi /n)/为高的小矩形。所 得图形叫频率直方图。这种小矩形的面积就等于数据落在 该小区间的频率fi /n。 由于当n很大时,频率就接近于概率,因而一般来说,每 个小区间上的小矩形面积接近于概率密度曲线之下该小区 间上的曲边梯形的面积。于是,一般来说,直方图的外廓 曲线接近于总体X的概率密度曲线。 本例的直方图看起来很像来自于某一正态总体X。 从直方图上可以直接估计X落在某一区间的概率 O 129.5 134.5 139.5 144.5 149.5 154.5 159.5 0.095 0.071 0.048 0.024 (fi/n)/
§6.2直方图和箱线图 二)箱线图 。先介绍样本分位数。 定义设有容量为n的样本观察值1,x2,…,xn, 样本P分位数(0<p<1)记为x,它具有以下性质: (1)至少有p个观察值小于或等于xp; 。(2)至少有(1-p)个观察值大于或等于xp。 21/82
21/82 §6.2 直方图和箱线图 (二)箱线图 先介绍样本分位数。 定义 设有容量为n的样本观察值x1,x2,…,xn, 样本p分位数(0<p<1)记为xp,它具有以下性质: ⚫ (1) 至少有np个观察值小于或等于xp; ⚫ (2) 至少有n(1-p)个观察值大于或等于xp