描述性统计 实际工作中,常常需要对得到的统计数据等进行简单的归纳分析,来描述数 据的状况,称之为描述性统计。 在描述性统计中,主要使用中心趋势、离中趋势、偏度度量、峰度度量等方 法来对数据的集中性、分散性、对称性、尖端性来进行描述,归纳数据的统计特性。 本章将介绍如何应用Exc1来求解各种统计量和采用分析工具中的描述统计宏来实现 对观测数据的描述性统计。 2.1中心趋势 中心趋势又称为定位度量或者平均数,是一组数据典型的或有代表性的值,由于这样 的典型值趋向于落在根据数值大小排列的数据的中心,因此被称为中心趋势度量。 可以定义多种类型的中心趋势,但最常用的有算数平均值、几何平均值、众数、中位 数和调和平均数。合适的平均值的选取取决于数据的性质,同样也取决于所使用的度量方 法。选取何种度量中心趋势要根据实际需要进行抉择,如算术平均值虽较常用但极易受到 特异值的影响,中位数和众数虽不受特异值的影响,但在进一步的分析中却用处不大,而
描述性统计 实际工作中,常常需要对得到的统计数据等进行简单的归纳分析,来描述数 据的状况,称之为描述性统计。 在描述性统计中,主要使用中心趋势、离中趋势、偏度度量、峰度度量等方 法来对数据的集中性、分散性、对称性、尖端性来进行描述,归纳数据的统计特性。 本章将介绍如何应用Excel来求解各种统计量和采用分析工具中的描述统计宏来实现 对观测数据的描述性统计。 2.1 中 心 趋 势 中心趋势又称为定位度量或者平均数,是一组数据典型的或有代表性的值,由于这样 的典型值趋向于落在根据数值大小排列的数据的中心,因此被称为中心趋势度量。 可以定义多种类型的中心趋势,但最常用的有算数平均值、几何平均值、众数、中位 数和调和平均数。合适的平均值的选取取决于数据的性质,同样也取决于所使用的度量方 法。选取何种度量中心趋势要根据实际需要进行抉择,如算术平均值虽较常用但极易受到 特异值的影响,中位数和众数虽不受特异值的影响,但在进一步的分析中却用处不大,而 在
Excel统计分析实例精讲 几何平均值在计算平均的变化比率时具有一技之长。 2.1.1算数平均值 算数平均数是应用最为广泛的中心趋势度量,也被称为平均值(average)。算术平均 值的求解根据数据类型的不同可分为非组数据的算术平均值和组数据的算术平均值。 非组数据的算术平均值:将所有单个观测值相加再除以观测值总数目求得。W个数X, 及,名,…,K的算术平均值为 x=X+X,+X,+A+Xx=∑X N N 对于组数据,等级区间的上下限经常未定,因此对于上下限未定的组数据,通常首先 要根据数据的特性假定限值,然后求解算术平均值。 组数据的算术平均值计算公式为 X= 其中,X为每个等级区间的中点:f为每个等级区间的频率;m为等级区间的数目:为数 据观测值的总数目。 例2.1求非组数据的算术平均值 10种股票2005年3月20日的收盘价格如表2-1所示,试求该10种股票价格当日的算术平 均值。 表2-1股票收盘价 代码 证券名 价格 代码 证券名 价格 600000 浦发银行 7.24 600011 华能国际 6.97 600004 白云机场 8.54 600015 华夏银行 4.05 600006 东风汽车 2.94 600016 民生银行 5.69 600008 首创股份 8.2 600018 上港集箱 16.37 600009 上海机场 16.65 600019 宝钢股份 6.17 1.根据定义求算术平均值 具体操作步骤如下: (1)新建一工作表“例2.1”,输入表头“股票价格算术平均值”,输入已知表2-1 中的信息。 (2)单击工具栏的求和按钮三,Exce1默认给出对C3:C12单元格进行求和,按回车键 即可。 (3)求算术平均值,单击C14单元格,在编辑栏输入“=C13/10”,完成后按回车键, 110 ·28·■
Excel 统计分析实例精讲 · 28 · 几何平均值在计算平均的变化比率时具有一技之长。 2.1.1 算数平均值 算数平均数是应用最为广泛的中心趋势度量,也被称为平均值(average)。算术平均 值的求解根据数据类型的不同可分为非组数据的算术平均值和组数据的算术平均值。 非组数据的算术平均值:将所有单个观测值相加再除以观测值总数目求得。N 个数 X1, X2,X3,…,XN的算术平均值为 N X N X X X X X N ∑= + + + + = 1 2 3 Λ 对于组数据,等级区间的上下限经常未定,因此对于上下限未定的组数据,通常首先 要根据数据的特性假定限值,然后求解算术平均值。 组数据的算术平均值计算公式为 n f X X m i ∑ i = = 1 其中,Xi为每个等级区间的中点;f 为每个等级区间的频率;m为等级区间的数目;n为数 据观测值的总数目。 例 2.1 求非组数据的算术平均值 10种股票2005年3月20日的收盘价格如表2-1所示,试求该10种股票价格当日的算术平 均值。 表2-1 股票收盘价 代码 证券名 价格 代码 证券名 价格 600000 浦发银行 7.24 600011 华能国际 6.97 600004 白云机场 8.54 600015 华夏银行 4.05 600006 东风汽车 2.94 600016 民生银行 5.69 600008 首创股份 8.2 600018 上港集箱 16.37 600009 上海机场 16.65 600019 宝钢股份 6.17 1. 根据定义求算术平均值 具体操作步骤如下: (1)新建一工作表“例2.1”,输入表头“股票价格算术平均值”,输入已知表2-1 中的信息。 (2)单击工具栏的求和按钮 ,Excel默认给出对C3:C12单元格进行求和,按回车键 即可。 (3)求算术平均值,单击C14单元格,在编辑栏输入“=C13/10”,完成后按回车键
■■■■■■ 第2章描述性统计 结果如图2-1所示。 辰票价格翼术平均值 2 代到 证券名: 价格 3 600000浦发银行 7.24 600004白云机场 8.54 600006东风汽车 2.94 6 c00008首创服份 B.2 7600009上海机场 16.65 8600011华能国际 用公式求出 6.97 g600015华夏银行 4.05 算术平均值 10 600016民生银行 5.69 11 600018上灌集箱 16.37 12 600019宝钢积份 6.17 13 求和 62.2 14 篷术平均值 &282 图2-1股票价格算术平均值 2.采用AVERAGE函数求算术平均值 除了采用公式外,Excel:还给出了AVERAGE函数来求算术平均值,具体操作步骤如下: (1)新建一工作表“例2.1”,输入表头“股票价格算术平均值”和表2-1中信息。 (2)单击G13单元格,单击插入函数按钮,选择【统计】/【AVERAGE】,Excel默 认对C3:C12单元格求算术平均值,按回车键即可。 说明:AVERAGE,返回参数的算术平均值。 语法:AVERAGE(Numberl,Number2,.),其中umberl,Number2,..为需要计 算平均值的1`30个参数。 最终结果如图2-2所示。 1 股票价格星术平均值 2代码证券名价格 3 600000浦发银行 7.24 4 600004白云机场 854 5600006东风汽车 2.94 6 60000g首创般份 8,2 用函数求出 600009上海机场 16.65 600011华能国际 6.97 算术平均值 9 600015华夏银行 4.05 10 600016民生银行 569 11600018上港集霜 16.37 12 600019宝钢般份 617 13 算术平均值 8.282=AEAG2(G3:G12 14 图2-2使用AVERAGE函数求算术平均值 从图2-1和图2-2中可以看出,两种方法计算结果完全相同,10种股票的平均价格为8.28 元。 例2.2求组数据的算术平均值 某班学生的体育课成绩的组数据如表2-2所示,试求该班体育课成绩的算术平均值。 1·29· 1i
第 2 章 描述性统计 · 29 · 结果如图2-1所示。 图 2-1 股票价格算术平均值 2. 采用 AVERAGE 函数求算术平均值 除了采用公式外,Excel还给出了AVERAGE函数来求算术平均值,具体操作步骤如下: (1)新建一工作表“例 2.1”,输入表头“股票价格算术平均值”和表 2-1 中信息。 (2)单击 G13 单元格,单击插入函数按钮 ,选择【统计】/【AVERAGE】,Excel 默 认对 C3:C12 单元格求算术平均值,按回车键即可。 说明:AVERAGE,返回参数的算术平均值。 语法:AVERAGE(Number1, Number2,...),其中Number1, Number2, ...为需要计 算平均值的1~30个参数。 最终结果如图 2-2 所示。 图 2-2 使用 AVERAGE 函数求算术平均值 从图2-1和图2-2中可以看出,两种方法计算结果完全相同,10种股票的平均价格为8.28 元。 例 2.2 求组数据的算术平均值 某班学生的体育课成绩的组数据如表2-2所示,试求该班体育课成绩的算术平均值。 用函数求出 算术平均值 用公式求出 算术平均值
Excel统计分析实例精讲 表2-2某班学生体育课成绩 成绩 中点(Xi) 频率(f) 成绩 中点(Xi) 频率(f) 4050 46.8 3 70^80 77.5 22 5060 56.0 5 8090 84.2 19 6070 64.3 9 90100 92.0 6 具体操作步骤如下: (1)新建一工作表“例2.2”,输入表头“组数据的算术平均”,输入表2-2中已知 信息。 (2)求fX值。单击D3单元格,在编辑栏输入“=B3C3”。单击D3,将鼠标置于D3 单元格右下角,当出现小黑十字光标,拖动至D8单元格,完成自动填充单元格。 (3)求观测点总数,单击C9单元格,单击工具栏求和按钮Σ,按回车键即可。 (4)求fX的和,单击D9单元格,单击工具栏求和按钮Σ,按回车键即可。 (5)求算术平均值,单击D10单元格,在编辑栏输入“=D9/C9”,最终结果如图2-3 所示。 组数的氧术平均 2 中点(x0频事(D 3 40-0 6.8 3 140.4 4 50.0 6 2810 0.70 6H1 578T 6 70-8077.5 22 17050 7 8090811 19 1599.8 成绩的算术平均值 8 0-100 5520 9 来和 64 48559S2 10 算术平均值 759D9/09 图2-3体育课成绩的算术平均值 从图2-3中可以看出,该班体育课成绩的算术平均值为75.9分。 2.1.2几何平均值 几何平均数也是度量平均值的一种方法,尤其是在计算平均增长率、平均收益率时被 经常使用。 因为许多情况下采用简单的算术平均值往往会得出无法理解的结论:例如某人在第一 年初即将100元进行投资,结果由于投资失利,第一年末亏损了50元,则对应的第一年的 收益率为(50-100)/100=-50%:但投资者并未灰心,在第二年初拿着剩余的50元再次投 资,恰逢良时,大赚50元,第二年末财富又达到了100元,且对应第二年的收益率为(100-50) /50=100%,那么此投资者两年的平均收益率是多少呢?按照算术平均值则投资者的平均收 益率为(-50%+100)/2=25%,可事实上投资者两年下来一分未赚。此时采用几何平均值便 能更好地描述投资者的平均收益率。 像周期增长率、收益率指标等中心趋势的较好度量是几何平均值,度量m年的增长率 的几何平均值应为 n ·30·■
Excel 统计分析实例精讲 · 30 · 表2-2 某班学生体育课成绩 成绩 中点(Xi) 频率(f) 成绩 中点(Xi) 频率(f) 40~50 46.8 3 70~80 77.5 22 50~60 56.0 5 80~90 84.2 19 60~70 64.3 9 90~100 92.0 6 具体操作步骤如下: (1)新建一工作表“例 2.2”,输入表头“组数据的算术平均”,输入表 2-2 中已知 信息。 (2)求 f X 值。单击 D3 单元格,在编辑栏输入“=B3*C3”。单击 D3,将鼠标置于 D3 单元格右下角,当出现小黑十字光标,拖动至 D8 单元格,完成自动填充单元格。 (3)求观测点总数,单击 C9 单元格,单击工具栏求和按钮 ,按回车键即可。 (4)求 f X 的和,单击 D9 单元格,单击工具栏求和按钮 ,按回车键即可。 (5)求算术平均值,单击 D10 单元格,在编辑栏输入“=D9/C9”,最终结果如图 2-3 所示。 图 2-3 体育课成绩的算术平均值 从图 2-3 中可以看出,该班体育课成绩的算术平均值为 75.9 分。 2.1.2 几何平均值 几何平均数也是度量平均值的一种方法,尤其是在计算平均增长率、平均收益率时被 经常使用。 因为许多情况下采用简单的算术平均值往往会得出无法理解的结论:例如某人在第一 年初即将 100 元进行投资,结果由于投资失利,第一年末亏损了 50 元,则对应的第一年的 收益率为(50-100)/100=-50%;但投资者并未灰心,在第二年初拿着剩余的 50 元再次投 资,恰逢良时,大赚 50元,第二年末财富又达到了 100元,且对应第二年的收益率为(100-50) /50=100%,那么此投资者两年的平均收益率是多少呢?按照算术平均值则投资者的平均收 益率为(-50%+100)/2=25%,可事实上投资者两年下来一分未赚。此时采用几何平均值便 能更好地描述投资者的平均收益率。 像周期增长率、收益率指标等中心趋势的较好度量是几何平均值,度量 m 年的增长率 的几何平均值应为 成绩的算术平均值
第2章描述性统计 Xg=婴X1×X2×XxA×Xm-1 其中X是1+r,:为第i年的增长率。 例2.3求几何平均值 对应上证180指数的2003年12月份和2004年每月的指数值如表2-3所示,求2004年12个 月指数的平均收益率。 表2-3上证180指数13个月观测值 月份 指数值 月份 指数值 2003-12 2828.80 2004-7 2548.49 2004-1 3019.04 2004-8 2479.16 2004-2 3140.53 2004-9 2591.00 2004-3 3213.48 2004-10 2452.73 2004-4 2912.81 2004-11 2490.28 2004-5 2819.49 2004-12 2362.07 2004-6 2528.44 1.使用定义求几何平均 具体操作步骤如下: (1)新建一工作表“例2.3”,输入表头“上证180指数收益率几何平均值”,输入表 2-3中的月份和指数值数据。 (2)求出12个月的收益率r,单击C4单元格,在编辑栏输入“=B4/B3-1”,单击C4单 元格拖动鼠标至C15单元格,运用自动填充单元格求出12月的收益率。 (3)求出12个月1+,单击D4单元格,在编辑栏输入“=C4+1”,单击D4单元格拖动 鼠标至D15单元格,运用自动填充单元格求出12月的1+r。 (4)运用公式求解几何平均值,单击D16单元格,输入“=P0WER(D4D5D6D7D8* D9*010*D11D12*D13*D14*D15,1/12)-1”。 说明:POWER是指返回给定数字的乘幂。 语法:POWER(Number,Power),其中umber为底数,可以为任意实数,Power为指 数,底数按该指数次幂乘方。 应说明的是通常输入中可以用“·”运算符代替函数POWER来表示对底数乘方的幂 次。 最终结果如图2-4所示。 ·31· 1i
第 2 章 描述性统计 · 31 · = 1 × 2 × 3× × −1 m X g X X X Λ X m 其中Xi是1+ri,ri为第 i 年的增长率。 例 2.3 求几何平均值 对应上证180指数的2003年12月份和2004年每月的指数值如表2-3所示,求2004年12个 月指数的平均收益率。 表2-3 上证180指数13个月观测值 月份 指数值 月份 指数值 2003-12 2828.80 2004-7 2548.49 2004-1 3019.04 2004-8 2479.16 2004-2 3140.53 2004-9 2591.00 2004-3 3213.48 2004-10 2452.73 2004-4 2912.81 2004-11 2490.28 2004-5 2819.49 2004-12 2362.07 2004-6 2528.44 1. 使用定义求几何平均 具体操作步骤如下: (1)新建一工作表“例2.3”,输入表头“上证180指数收益率几何平均值”,输入表 2-3中的月份和指数值数据。 (2)求出12个月的收益率r,单击C4单元格,在编辑栏输入“=B4/B3-1”,单击C4单 元格拖动鼠标至C15单元格,运用自动填充单元格求出12月的收益率。 (3)求出12个月1+r,单击D4单元格,在编辑栏输入“=C4 +1”,单击D4单元格拖动 鼠标至D15单元格,运用自动填充单元格求出12月的1+r。 (4)运用公式求解几何平均值,单击D16单元格,输入“=POWER(D4*D5*D6*D7*D8* D9*D10*D11*D12*D13*D14*D15,1/12)-1”。 说明:POWER是指返回给定数字的乘幂。 语法:POWER(Number,Power),其中Number为底数,可以为任意实数,Power为指 数,底数按该指数次幂乘方。 应说明的是通常输入中可以用“^”运算符代替函数POWER来表示对底数乘方的幂 次。 最终结果如图2-4所示