Excel统计分析实例精讲 一部分数据进行观测,这一部分即为样本。 如果样本能很好地反映总体的特性,那么就可以通过样本的分析来对总体下结论,在 这种情况下进行的统计工作称为归纳统计学或统计推断。如某学校辅导员需要对毕业生找 工作时的服装消费状况进行调查,一种方法是该辅导员通过动员所有院系的辅导员将所有 毕业生的花费进行逐一统计,最终得到毕业生服装花费的总体。但实际中往往无法也没必 要统计所有同学的消费金额,因此我们可以采用另一种方法,即通过在每个院系中抽取一 定数量的学生进行调查,调查所得的数据即为样本,根据抽取的样本即可推断出所有毕业 生服装花费的总体。 如果仅仅描述和分析特定的对象而不下结论或者对较大的群体不进行推断,而用一个 数来概括一组数据的特征,这种情况下的统计称为描述性统计或演绎统计学。 1.2数据类型 数据有各种各样的形式,数据类型往往决定或影响统计分析所使用方法的选择,因此 在应用Excel:进行统计分析之前,必须明确数据的不同类型。 1.2.1连续数据与离散数据 按照是否连续,数据可以分为连续(continous)数据和离散(discrete)数据。连续 数据可以取区间内的任何值,也就是说数据可用一个连续的标准度量,度量值只受精度的 限制。典型的连续数据的例子是投资收益率,收益可以为5%,或者5.001%,或者4.9999%, 还有时间、速度等。 离型数据则仅能取区间内的有限个值,例如由于股票受最小变动单位的限制,如果股 票的最小变动单位为0.01元,对应股票的价格只能为5,或者5.01,或者4.99,而不能为 5.005,同样的还有班级人数、股票的成交量等。 后面章节的例子将会说明连续数据和离散数据对描述统计量的计算产生的差别。 1.2.2横截面数据和时间序列数据 按照数据反映的时间,数据可分为横截面数据和时间序列数据。横截面数据描述的是 某一特定时间的一组变量的状况,例如表1-1中描述的2005年3月21日上证50指数样本股的 20种股票的收盘价格的一组数据,即为横截面数据。 时间序列数据则反映某一特定变量随时间的变化,最为典型的就是股票价格的时间序 列,如表1-2中深发展(000001)在2004年12月中22个交易日的价格组成的数据,即为时间 序列数据。 ·2
Excel 统计分析实例精讲 · 2 · 一部分数据进行观测,这一部分即为样本。 如果样本能很好地反映总体的特性,那么就可以通过样本的分析来对总体下结论,在 这种情况下进行的统计工作称为归纳统计学或统计推断。如某学校辅导员需要对毕业生找 工作时的服装消费状况进行调查,一种方法是该辅导员通过动员所有院系的辅导员将所有 毕业生的花费进行逐一统计,最终得到毕业生服装花费的总体。但实际中往往无法也没必 要统计所有同学的消费金额,因此我们可以采用另一种方法,即通过在每个院系中抽取一 定数量的学生进行调查,调查所得的数据即为样本,根据抽取的样本即可推断出所有毕业 生服装花费的总体。 如果仅仅描述和分析特定的对象而不下结论或者对较大的群体不进行推断,而用一个 数来概括一组数据的特征,这种情况下的统计称为描述性统计或演绎统计学。 1.2 数 据 类 型 数据有各种各样的形式,数据类型往往决定或影响统计分析所使用方法的选择,因此 在应用Excel进行统计分析之前,必须明确数据的不同类型。 1.2.1 连续数据与离散数据 按照是否连续,数据可以分为连续(continous)数据和离散(discrete)数据。连续 数据可以取区间内的任何值,也就是说数据可用一个连续的标准度量,度量值只受精度的 限制。典型的连续数据的例子是投资收益率,收益可以为5%,或者5.001%,或者4.9999%, 还有时间、速度等。 离型数据则仅能取区间内的有限个值,例如由于股票受最小变动单位的限制,如果股 票的最小变动单位为0.01元,对应股票的价格只能为5,或者5.01,或者4.99,而不能为 5.005,同样的还有班级人数、股票的成交量等。 后面章节的例子将会说明连续数据和离散数据对描述统计量的计算产生的差别。 1.2.2 横截面数据和时间序列数据 按照数据反映的时间,数据可分为横截面数据和时间序列数据。横截面数据描述的是 某一特定时间的一组变量的状况,例如表1-1中描述的2005年3月21日上证50指数样本股的 20种股票的收盘价格的一组数据,即为横截面数据。 时间序列数据则反映某一特定变量随时间的变化,最为典型的就是股票价格的时间序 列,如表1-2中深发展(000001)在2004年12月中22个交易日的价格组成的数据,即为时间 序列数据
第1章统计基础与数据描述 表1-1上证50指数样本股横截面数据 代码 证券名 价格 代码 证券名 价格 600000 浦发银行 7.24 600026 中海发展 9.65 600004 白云机场 8.54 600028 中国石化 4.20 600006 东风汽车 2.94 600029 南方航空 3.75 600008 首创股份 8.20 600030 中信证券 5.00 600009 上海机场 16.65 600033 福建高速 8.38 600011 华能国际 6.97 600036 招商银行 8.51 600015 华夏银行 4.05 600050 中国联通 2.90 600016 民生银行 5.69 600100 清华同方 12.92 600018 上港集箱 16.37 600104 上海汽车 4.66 600019 宝钢股份 6.17 600171 上海贝岭 8.42 表1-2深发展2004年12月价格 日期 价格 日期 价格 2004-12-1 6.94 2004-12-12 6.91 2004-12-2 2004-12-13 6.86 2004-12-3 7.02 2004-12-14 6.86 2004-12-4 6.98 2004-12-15 6.97 2004-12-5 7 2004-12-16 6.88 2004-12-6 6.96 2004-12-17 6.82 2004-12-7 7.09 2004-12-18 6.75 2004-12-8 6.94 2004-12-19 6.69 2004-12-9 6.87 2004-12-20 6.66 2004-12-10 6.96 2004-12-21 6.58 2004-12-11 6.99 2004-12-22 6.59 1.2.3组数据和非组数据 按照数据是否分组,数据又可分为组数据和非组数据。当只有较少部分数据被处理时, 这些数据可能是未被加工的或者处于非组状态(ungrouped),这样的数据称为非组数据。 但由于信息量较少,读者仍然能理解这些数据,如表1-3中是上证180指数2004年12个月度 观测值。 表1-3上证180指数2004年月度值 月 2004-1 2004-2 2004-3 2004-4 2004-5 2004-6 值 3019.04 3140.53 3213.48 2912.81 2819.49 2528.44 月 2004-7 2004-8 2004-9 2004-10 2004-11 2004-12 值 2548.49 2479.16 2591.00 2452.73 2490.28 2362.07 但当数据量相当大时,例如,如果需要描述2002年到2004年3年间上证180指数的月度 值和月度收益,此时如果不经加工汇总,便无法直接看出其中的规律,这时就需要将其加 ·3。 1II
第 1 章 统计基础与数据描述 · 3 · 表1-1 上证50指数样本股横截面数据 代码 证券名 价格 代码 证券名 价格 600000 浦发银行 7.24 600026 中海发展 9.65 600004 白云机场 8.54 600028 中国石化 4.20 600006 东风汽车 2.94 600029 南方航空 3.75 600008 首创股份 8.20 600030 中信证券 5.00 600009 上海机场 16.65 600033 福建高速 8.38 600011 华能国际 6.97 600036 招商银行 8.51 600015 华夏银行 4.05 600050 中国联通 2.90 600016 民生银行 5.69 600100 清华同方 12.92 600018 上港集箱 16.37 600104 上海汽车 4.66 600019 宝钢股份 6.17 600171 上海贝岭 8.42 表1-2 深发展2004年12月价格 日期 价格 日期 价格 2004-12-1 6.94 2004-12-12 6.91 2004-12-2 7 2004-12-13 6.86 2004-12-3 7.02 2004-12-14 6.86 2004-12-4 6.98 2004-12-15 6.97 2004-12-5 7 2004-12-16 6.88 2004-12-6 6.96 2004-12-17 6.82 2004-12-7 7.09 2004-12-18 6.75 2004-12-8 6.94 2004-12-19 6.69 2004-12-9 6.87 2004-12-20 6.66 2004-12-10 6.96 2004-12-21 6.58 2004-12-11 6.99 2004-12-22 6.59 1.2.3 组数据和非组数据 按照数据是否分组,数据又可分为组数据和非组数据。当只有较少部分数据被处理时, 这些数据可能是未被加工的或者处于非组状态(ungrouped),这样的数据称为非组数据。 但由于信息量较少,读者仍然能理解这些数据,如表1-3中是上证180指数2004年12个月度 观测值。 表1-3 上证180指数2004年月度值 月 2004-1 2004-2 2004-3 2004-4 2004-5 2004-6 值 3 019.04 3 140.53 3 213.48 2 912.81 2 819.49 2 528.44 月 2004-7 2004-8 2004-9 2004-10 2004-11 2004-12 值 2 548.49 2 479.16 2 591.00 2 452.73 2 490.28 2 362.07 但当数据量相当大时,例如,如果需要描述2002年到2004年3年间上证180指数的月度 值和月度收益,此时如果不经加工汇总,便无法直接看出其中的规律,这时就需要将其加
Excel统计分析实例精讲 ■■■■ 工汇总,将非组数据转化为一个频率表(frequency),以便分析人员能方便地掌握,此时 便将非组数据转化成为组(grouped)数据。 下面通过举例说明如何在Excel中实现将非组数据转化为组数据。 例1.1求解上证180指数的月收益率 上证180指数2002年到2004年对应的月度观测值如表1-4所示,试求指数对应的月收益 率(其中月收益率=(本月指数值-上月指数值)/上月指数值)。 表1-4上证180指数2002年至2004年月度值 时间 指数值 时间 指数值 时间 指数值 2002-1 2828.95 2003-1 2794.97 2004-1 3019.04 2002-2 2869.65 2003-2 2793.41 2004-2 3140.53 2002-3 2941.43 2003-3 2810.75 2004-3 3213.48 2002-4 3028.49 2003-4 2882.80 2004-4 2912.81 2002-5 2773.89 2003-5 3010.19 2004-5 2819.49 2002-6 3299.06 2003-6 2846.85 2004-6 2528.44 2002-7 3138.92 2003-7 2861.76 2004-7 2548.49 2002-8 3124.83 2003-8 2741.57 2004-8 2479.16 2002-9 2953.91 2003-9 2619.23 2004-9 2591.00 2002-10 2817.64 2003-10 2592.19 2004-10 2452.73 2002-11 2658.88 2003-11 2681.86 2004-11 2490.28 2002-12 2561.45 2003-12 2828.80 2004-12 2362.07 具体操作步骤如下: (1)新建一空白工作表,单击A1单元格,输入表头“上证180指数”。 (2)首先合并单元格以设置表头,选择A1:D1单元格,右击选中的区域,从出现的快 捷菜单中选择【设置单元格格式】命令,出现【单元格格式】对话框,在【数字】选项卡 中选择【文本】,如图1-1所示。 事元鲁精式 上过1作数 选择文本格式 图1-1【数字】选项卡
Excel 统计分析实例精讲 · 4 · 工汇总,将非组数据转化为一个频率表(frequency),以便分析人员能方便地掌握,此时 便将非组数据转化成为组(grouped)数据。 下面通过举例说明如何在Excel中实现将非组数据转化为组数据。 例 1.1 求解上证 180 指数的月收益率 上证180指数2002年到2004年对应的月度观测值如表1-4所示,试求指数对应的月收益 率(其中月收益率 =(本月指数值-上月指数值)/上月指数值)。 表1-4 上证180指数2002年至2004年月度值 时间 指数值 时间 指数值 时间 指数值 2002-1 2 828.95 2003-1 2 794.97 2004-1 3 019.04 2002-2 2 869.65 2003-2 2 793.41 2004-2 3 140.53 2002-3 2 941.43 2003-3 2 810.75 2004-3 3 213.48 2002-4 3 028.49 2003-4 2 882.80 2004-4 2 912.81 2002-5 2 773.89 2003-5 3 010.19 2004-5 2 819.49 2002-6 3 299.06 2003-6 2 846.85 2004-6 2 528.44 2002-7 3 138.92 2003-7 2 861.76 2004-7 2 548.49 2002-8 3 124.83 2003-8 2 741.57 2004-8 2 479.16 2002-9 2 953.91 2003-9 2 619.23 2004-9 2 591.00 2002-10 2 817.64 2003-10 2 592.19 2004-10 2 452.73 2002-11 2 658.88 2003-11 2 681.86 2004-11 2 490.28 2002-12 2 561.45 2003-12 2 828.80 2004-12 2 362.07 具体操作步骤如下: (1)新建一空白工作表,单击A1单元格,输入表头“上证180指数”。 (2)首先合并单元格以设置表头,选择A1:D1单元格,右击选中的区域,从出现的快 捷菜单中选择【设置单元格格式】命令,出现【单元格格式】对话框,在【数字】选项卡 中选择【文本】,如图1-1所示。 图 1-1 【数字】选项卡 选择文本格式
■■■■■■ 第1章统计基础与数据描述 (3)选择【单元格格式】对话框的【对齐】选项卡,单击选中【合并单元格】前的复 选框,如图1-2所示。 (4)选择【单元格格式】对话框的【字体】选项卡,在【字体】列表中选择【宋体】, 在【字号】列表中选择【12】,如图1-3所示,完成后单击【确定】按钮。 作元格棉式 上香为试 量口其济: 度制 ■相字体填克) 0度 已合并单无格健一 有型 文市方有D: 选中合并单元格 推推内后 图1-2【对齐】选项卡 带元色静式 体生 车号④ 17 3 选中宋体 桥色C: 选择12号 口制鞋核建 张软卓时AaCe ☐0 图1-3【字体】选项卡 (5)单击单元格A2,输入“时间”:单击单元格B2,输入“指数”:单击单元格C2, 输入“收益率”。 (6)单击单元格A3,输入“2002-1”,右击A3,选择【设置单元格格式】命令,在出 现的【单元格格式】对话框中,选择【数字】选项卡中的【自定义】命令,在【类型】文 本框中输入需要的格式“yyyy-m”,如图1-4所示,完成后单击【确定】按钮。 (7)运用自动填充单元格命令给出所有的日期,单击A3单元格,将光标置于A3单元格 右下角,此时光标变为小黑十字,如图1-5所示,拖动鼠标至A38单元格,即可实现所有日 期的自动填充。 说明:自动填充功能是Excl的一大特色,熟练的使用自动填充功能将大大简化某 些重复性输入工作。 5 1i
第 1 章 统计基础与数据描述 · 5 · (3)选择【单元格格式】对话框的【对齐】选项卡,单击选中【合并单元格】前的复 选框,如图1-2所示。 (4)选择【单元格格式】对话框的【字体】选项卡,在【字体】列表中选择【宋体】, 在【字号】列表中选择【12】,如图1-3所示,完成后单击【确定】按钮。 图 1-2 【对齐】选项卡 图 1-3 【字体】选项卡 (5)单击单元格A2,输入“时间”;单击单元格B2,输入“指数”;单击单元格C2, 输入“收益率”。 (6)单击单元格A3,输入“2002-1”,右击A3,选择【设置单元格格式】命令,在出 现的【单元格格式】对话框中,选择【数字】选项卡中的【自定义】命令,在【类型】文 本框中输入需要的格式“yyyy-m”,如图1-4所示,完成后单击【确定】按钮。 (7)运用自动填充单元格命令给出所有的日期,单击A3单元格,将光标置于A3单元格 右下角,此时光标变为小黑十字,如图1-5所示,拖动鼠标至A38单元格,即可实现所有日 期的自动填充。 说明:自动填充功能是Excel的一大特色,熟练的使用自动填充功能将大大简化某 些重复性输入工作。 选中合并单元格 选中宋体 选择12号
Excel统计分析实例精讲 ?X 选中自定义 输入自定义格式 凭南惊式中基连生东自堂我村量中惊式 图1-4自定义数字格式 A B 上证180指数 时何 指数收益事 2002-1 4 小黑十字光标 图1-5 自动填充 (8)在B3到B38单元格中输入对应每月的指数观测值。 (9)求解每月收益率,月收益率=(本月指数-上月指数)/上月指数。 单击C4单元格,在编辑栏中输入“=(”,单击B4单元格,在编辑栏中输入“-”,单 击B3单元格,在编辑栏中输入“)/”,再单击B3单元格,完成后按回车键。 (10)采用自动填充单元格求出其他月份的收益率。单击C4单元格,将鼠标置于C4单 元格右下角,出现小黑十字光标后,拖动鼠标至C38单元格,即可将所有月份的收益率全部 求出。 最终结果如图1-6所示,由于篇幅限制,隐藏了15-26行2003年间的记录。 A》 上证180时指数 指数收益率 3 2002-1282895 2002-22.869.650.01438 月收益率 2002-2941430015014 1002-43.028490.029598 3002-5177389 +008107 2002.61.199060189326 9 1062.73.13891 -004854 102002-83.124.83-000449 200291.95391 0.0347 12 2002-102.81764 00t613 132002-112.658.88 -0046名 14 2002-12256145-00366 2004.11019.04 0.062251 1001-13140530010211 29 200-3 21348 0.023229 209-4291281-009347 2004-5281949 0.03204 32 2001.6252811-010323 2004-72.54849 000793 34 2004-81479.16 0022 1001.91591000015111 2004-10245273 -005337 2004-111490280.015309 2004-122.36207-00514据 39 图1-6上证180指数月收益率 ·6
Excel 统计分析实例精讲 · 6 · 图 1-4 自定义数字格式 图 1-5 自动填充 (8)在B3到B38单元格中输入对应每月的指数观测值。 (9)求解每月收益率,月收益率=(本月指数-上月指数)/上月指数。 单击C4单元格,在编辑栏中输入“=(”,单击B4单元格,在编辑栏中输入“-”,单 击B3单元格,在编辑栏中输入“)/”,再单击B3单元格,完成后按回车键。 (10)采用自动填充单元格求出其他月份的收益率。单击C4单元格,将鼠标置于C4单 元格右下角,出现小黑十字光标后,拖动鼠标至C38单元格,即可将所有月份的收益率全部 求出。 最终结果如图1-6所示,由于篇幅限制,隐藏了15-26行2003年间的记录。 图 1-6 上证 180 指数月收益率 小黑十字光标 月收益率 输入自定义格式 选中自定义