如何绘制直方图?答:1)直方图的构成(1)直方图的纵坐标一一频数在测量中,数据的频数有两种表达的方式:第一种是累计一组数据中的某一数值重复出现的次数。例如测得10个零件加工后的尺寸,该组数据为9.8,9.6,9.8,9.8,10.0,9.7,9.9,9.8,9.7,9.9mm。经统计可知,9.8的频为4,9.9和9.7的频数皆为2,10.0和9.9的频数皆为1。第二种是把一组数据划分若干个区间,然后累计出现于该区间的数值个数。例如将上述10个数据划分为9.45一9.65,9.65~9.85,9.85~10.5三个区间.则第一区间的颇数为1,第二区间频数为6,第三区间频数为3。通常多用区间频数的方式。因为当数据个数比较多时,划分区间不但可以使作图简化,而且使分散的规律更加明显,有利于分析问题。(2)直方图的横坐标一一数据值如果一组数据不划分区间,则在横坐标上依大小顺序以测量单位为间隔标记各数值;如果把数据划分为区间,则在横坐标上也依大小顺序标记各区间的边界值。(3)直方图形以横坐标的每一数据与相邻数据的间隔或每一区间为底边,以该数据或该区间的频数为矩形高,按比例而构成的若干矩形,即得到直方图。2)直方图的作图步骤(1)收集数据一般100个左右,至少不少于50个,理论上数据越多越好,但因收集数据耗费时间、人力和费用,故有限度。(2)计算极差R=Xx-Xmin(3)适当分组组数的多少影响数据整理(或测量结果)的精确度。经验证明,组数太少会掩盖组内数据的变动情况,整理结果不精确:组数太多使各组的高度参差不齐,反而看不出明显的规律。且劳动量太大。因此,组数K的确定要适当,建议分组数参考组数选用表:统计点数n30S100>20020S30100200组数K5S775991212015(也可有公式m≤5gn计算)(4)确定组距组距用字母h表示,h=R/K。计算h时,一般取测量单位的整数倍,将数据修约(四舍五入),取一位有效数字(整数位)。(5)确定组界首先确定第一组下界限值,应注意使最小值包括在第一组内。为使数据测量值不落在上下界限值外,必须带上最小测量单位的1/2尾数,故第一组下界限值为Xmin-R/50,上界限值为(Xmin-R/50)+h。然后依次加入组距h,即可得到各组的上下界限值。第一组的上界限值为第二组的下界限值,第二组的下界限值加上h为第二组的上界限值,其余类推。最后一组应包含最大值Xmax。(6)计算组中值组中值是每组中间的数值,按下式计算:b=(第i组下界限值+第i组上界限值)/2
如何绘制直方图? 答:1)直方图的构成 (1)直方图的纵坐标——频数 在测量中,数据的频数有两种表达的方式: 第一种是累计一组数据中的某一数值重复出现的次数。例如测得 10 个零件加工后的尺 寸,该组数据为 9.8,9.6,9.8,9.8,lO.O,9.7,9.9,9.8,9.7,9.9mm。经统计可知,9.8 的频为 4,9.9 和 9.7 的频数皆为 2,10.0 和 9.9 的频数皆为 l。 第二种是把一组数据划分若干个区间,然后累计出现于该区间的数值个数。例如将上述 10 个数据划分为 9.45—9.65,9.65~9.85,9.85~10.5 三个区间.则第一区间的颇数为 1,第 二区间频数为 6,第三区间频数为 3。 通常多用区间频数的方式。因为当数据个数比较多时,划分区间不但可以使作图简化, 而且使分散的规律更加明显,有利于分析问题。 (2)直方图的横坐标——数据值 如果一组数据不划分区间,则在横坐标上依大小顺 序以测量单位为间隔标记各数值;如果把数据划分为区间,则在横坐标上也依大小顺序标记 各区间的边界值。 (3)直方图形 以横坐标的每一数据与相邻数据的间隔或每一区间为底边,以该数据 或该区间的频数为矩形高,按比例而构成的若干矩形,即得到直方图。 2)直方图的作图步骤 (1)收集数据 一般 100 个左右,至少不少于 50 个,理论上数据越多越好,但因收集数据耗费时间、 人力和费用,故有限度。 (2)计算极差 R = X max − X min (3)适当分组 组数的多少影响数据整理(或测量结果)的精确度。经验证明,组数太少会掩盖组内数 据的变动情况,整理结果不精确;组数太多使各组的高度参差不齐,反而看不出明显的规律。 且劳动量太大。 因此,组数 K 的确定要适当,建议分组数参考组数选用表: 统计点数 n 20∽30 30∽100 100∽200 >200 组 数 K 5∽7 7∽9 9∽12 12∽15 (也可有公式 m 5lg n 计算) (4)确定组距 组距用字母 h 表示,h=R/K。计算 h 时,一般取测量单位的整数倍,将数据修约(四舍 五入),取一位有效数字(整数位)。 (5)确定组界 首先确定第一组下界限值,应注意使最小值包括在第一组内。为使数据测量值不落在上 下界限值外,必须带上最小测量单位的 1/2 尾数,故第一组下界限值为 Xmin- R/50,上界限 值为(Xmin- R/50)+h。然后依次加入组距 h,即可得到各组的上下界限值。第一组的上界 限值为第二组的下界限值,第二组的下界限值加上 h 为第二组的上界限值,其余类推。最后 一组应包含最大值 Xmax。 (6)计算组中值 组中值是每组中间的数值,按下式计算: bi=(第 i 组下界限值+第 i 组上界限值)/2
实际上各组的组中值加上组距就是下一组的组中值。(7)编制频数分布表频所谓频数就是在n次实验中,数据数落入各组中的次数f。将所有测量数据分别记入相应的各组中,统计出频数Jj,于是得到频数分布表。(8)作直方图以纵坐标为频数,横坐标为数据测量值,以组距h为底边,数据测量值落入各组的频数f为高,画出一系列矩形这样得到的图形称为频数直方图,测量值简称直方图。如图所示。频率与测得值的直方图
实际上各组的组中值加上组距就是下一组的组中值。 (7)编制频数分布表 所谓频数就是在 n 次实验中,数据 落入各组中的次数 fi。将所有测量数据 分别记入相应的各组中,统计出频数 fi,于是得到频数分布表。 (8)作直方图 以纵坐标为频数,横坐标为数据测 量值,以组距 h 为底边,数据测量值落 入各组的频数 fi 为高,画出一系列矩形 ,这样得到的图形称为频数直方图, 简称直方图。如图所示。 频数 测量值