■第1室导论〉 3 1.企业发展战略 发展战略是一个企业的长远发展方向。制定发展战略一方面需要及时了解和把握 整个宏观经济的状况及发展变化趋势,了解市场的变化;另一方面,还要对企业进行 合理的市场定位,把握企业自身的优势和劣势。所有这些都离不开统计,需要统计提 供可靠的数据,利用统计方法对数据进行科学的分析和预测,等等。 2.产品质量管理 质量是企业的生命,是企业持续发展的基础。质量管理中离不开统计的应用。在 -些知名的跨国公司,6。准则已成为一种重要的管理理念。质量控制已成为统计学在 生产领域的一项重要应用。各种统计质量控制图广泛用于监测生产过程 3.市场研究 企业要在激烈的市场竞争中取得优势,首先必须了解市场,要了解市场,则需要 做广泛的市场调查,取得所需的信息,并对这些信息进行科学的分析,以便作为生产 和营销的依据,这些都需要统计的支持。 4.财务分析 上市公司的财务数据是股民投资的重要参考依据。一些投资咨询公司主要是根据 上市公司提供的财务和统计数据进行分析,为股民提供投资参考。企业自身的投资也 离不开对财务数据的分析,其中要用到大量的统计方法。 5.经济预测 企业要对未来的市场状况进行预测,经济学家也常常对宏观经济或某一方面进行 预测。在进行预测时要使用各种统计信息和统计方法。比如,企业要对产品的市场潜 力作出预测,以便及时调整生产计划,这就需要利用市场调查取得数据,并对数据进 行统计分析。经济学家在预测通货膨胀时,要利用有关生产价格指数、失业率、生产 能力利用等统计数据,然后通过统计模型进行预测。 6.人力资源管理 企业利用统计方法对员工的年龄、性别、受教育程度、工资等进行分析,并作为 企业制定工资计划、奖惩制度的依据。 当然,统计并不是仅仅为了管理才有用,它是为自然科学、社会科学的多个领域 而发展起来的,为多个学科提供了一种通用的数据分析方法。从某种意义上说,统计 仅仅是一种数据分析的方法。与数学一样,统计是一种工具,是一种数据分析的工 具。表1一1列出了统计的一些应用领域,目的是让我们通过简单浏览形成这样一个 概念:统计学非常有用! 表1-1 统计的应用领域 actuarial work(精算) auditing(审计学) (晶体学)》 (动物学 y入日统计学 lemography dentistry(牙科学) archacology(考古学) ecology(生态学)
统计学(第六版) econometrics(经济计量学) management science (管理科学) education(教有字) marketing(市场营销学) lction foreasting and p(选举预测和策划) medical diagnosis(医学诊断, engineering(工程) meteorology(气象学) epidemiology(流行病学) military science(军事科学) finance(金融) nuclear material safeguard(核材料安全管理 fisheries research(水产渔业研究) ophthalmology(眼科学 gambling(赌博) pharmaceutics(制药学) genetics(遗传学) ohysics(物理学) aphy(地理学) political scie nce(政治学】 ,(地质学) sychology(心理学) 、(心理物理学) an gene hydrology(水文学) 宗教研究 ndustry(T业 sociology(社会 inguistics(语言学) survey sampling(调查抽样) literature(文学) taxonomy(分类学) manpower planning(劳动力计划) weather modification(气象改善) 利用统计方法可以简化繁杂的数据,比如,用图表展示数据,建立数据模型 有人认为统计的全部目的就是让人看懂数据,其实这仅仅是统计的一个方面,统计 更重要的功能是对数据进行分析,它提供了一套分析数据的方法和工具。不同的人 对数据分析的理解也会大不一样,曲解数据分析是常见的现象。在有些人的心目 中,数据分析就是寻找支持:他们的心目中可能有了某种“结论”性的东西,或者 说他们希望看到一种符合他们需要的某种结论,而后去找些统计数据来支持他们的 结论。这恰恰歪曲了数据分析的本质,数据分析的真正目的是从数据中找出规律 从数据中寻找启发,而不是寻找支持。真正的数据分析事先是没有结论的,通过对 数据的分析才能得出结论。统计不是万能的,它不能解决你所面临的所有问题。统 计可以帮助分析数据,并从分析中得出某种结论,但对统计结论的进一步解释,则 需要你的专业知识。比如,吸烟会使患肺癌的概率增大,这是一个统计结论,但要 解释吸烟为什么能引起肺癌,这就不是统计学家所能做到的,需要有更多的医学知识 才行。 1.2统计数据的类型 统计数据是对现象进行测量的结果。比如,对经济活动总量的测量可以得到国内 生产总值(GDP)数据;对股票价格变动水平的测量可以得到股票价格指数的数据: 对人口性别的测量可以得到男或女这样的数据。下面从不同角度说明统计数据的 分类
第1导论-5 1.2.1分类数据、顺序数据、数值型数据 按照所采用的计量尺度不同①,可以将统计数据分为分类数据、顺序数据和数值 型数据。 分类数据(categorical data)是只能归于某一类别的非数字型数据,它是对事物 进行分类的结果,数据表现为类别,是用文字来表述的。例如,人口按照性别分为 男、女两类;企业按行业属性分为医药企业、家电企业、纺织品企业等,这些均属于 分类数据。为便于统计处理,对于分类数据可以用数字代码来表示各个类别,比如, 用1表示“男性”,0表示“女性”;用1表示“医药企业”,2表示“家电企业”,3表 示“纺织品企业”,等等。 顺序数据(rank data)是只能归于某一有序类别的非数字型数据。顺序数据虽然 也是类别,但这些类别是有序的。比如将产品分为一等品、二等品、三等品、次品 等;考试成绩可以分为优、良、中、及格、不及格等;一个人的受教育程度可以分为 小学、初中、高中、大学及以上;一个人对某一事物的态度可以分为非常同意、同 意、保持中立、不同意、非常不同意,等等。同样,顺序数据也可以用数字代码来表 示。比如,1—非常同意,2—同意,3—保持中立,4—不同意,5—非常 不同意 数值型数据(metric data)是按数字尺度测量的观察值,其结果表现为具体的数 值。现实中所处理的大多数都是数值型数据。 分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果 均表现为类别,因而也可统称为定性数据或品质数据(qualitative data);数值型数据 说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数 据(quantitative data)。 1.2.2观测数据和实验数据 按照统计数据的收集方法,可以将其分为观测数据和实验数据。观测数据(b servational data))是通过调查或观测而收集到的数据,这类数据是在没有对事物人为 控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。实验数据 (experimental data).则是在实验中控制实验对象而收集到的数据。比如,对一种新药 疗效的实验数据,对一种新的农作物品种的实验数据。自然科学领域的大多数数据都 为实验数据。 ①数据的测量尺度有四种,1)分类尺度 asc)。按照事物的某种属性对其进行平行的分类,数据 现为类别。(2)顺序尺度(ordinal ae).对事物类别顺序的测度,数据表现为有序的类别 Ca,对事物类别或次序之间间距的测度设有绝对零点,数据表现为数字。④)比率尺度(0a。】 对事物类 别或次序之间间距的测度,有绝对零点,数据表现为数字】
6 一统计学(第六版) 1.2.3截面数据和时间序列数据 按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数 据。截面数据(cross-sectional data)是在相同或近似相同的时间点上收集的数据, 这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。比 如,2010年我国各地区的国内生产总值数据就是截面数据。时间序列数据(time se ries data)是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于所描 述现象随时间变化的情况。比如2010一2012年我国的国内生产总值数据就是时间序 列数据。 图1一1给出了统计数据分类的框图。 统计数据的类型 按计量尺度 按收集方法 按时间状况 图1一1统计数据的分类 区分数据的类型是十分重要的,因为对不同类型的数据,需要采用不同的统计方 法来处理和分析。比如,对分类数据,我们通常计算出各组的频数或频率,计算其众 数和异众比率,进行列联表分析和×检验等;对顺序数据,可以计算其中位数和四 分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如 计算各种统计量,进行参数估计和检验等。 1.3统计中的几个基本概念 统计学中的概念很多,其中有几个概念是经常要用到的,有必要单独加以介绍。 这些概念包括总体和样本、参数和统计量、变量等。 1.3.1总体和样本 1.总体 总体(population)是包含所研究的全部个体(数据)的集合,它通常由所研究
■第1章导论C) 7 的一些个体组成,如由多个企业构成的集合,多个居民户构成的集合,多个人构成的 集合,等等。组成总体的每个元素称为个体,在由多个企业构成的总体中,每个企业 就是一个个体:由多个居民户构成的总体中,每个居民户就是一个个体;由多个人构 成的总体中,每个人就是一个个体 总体范围的确定有时比较容易。比如,要检验一批灯泡的使用寿命,这批灯泡构 成的集合就是总体,每个灯泡就是一个个体,总体的范围很清楚。但有些场合总体范 围的确定则比较困难,比如,对于新推出的一种饮料,要想知道消费者是否喜欢,首 先必须弄清哪些人是消费的对象,也就是要确定构成该饮料的消费者这一总体,但事 实上,我们很难确定哪些消费者消费该饮料,总体范围的确定十分复杂。当总体的范 围难以确定时,可根据研究的目的来定义总体。 总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体 是指总体的范围能够明确确定,而且元素的数目是有限可数的。比如,由若干个企业 构成的总体就是有限总体,一批待检验的灯泡也是有限总体。无限总体是指总体所包 括的元素是无限的、不可数的。例如,在科学实验中,每个实验数据可以看做总体的 一个元素,而实验则可以无限地进行下去,因此由实验数据构成的总体就是一个无限 总体。 总体分为有限总体和无限总体主要是为了判别在抽样中每次抽取是否独立。对于 无限总体,每次抽取一个单位,并不影响下一次的抽样结果,因此每次抽取可以看做 是独立的。对于有限总体,抽取一个单位后,总体元素就会减少一个,前一次的抽样 结果往往会影响第二次的抽样结果,因此每次抽取是不独立的。这些因素会影响到抽 样推断的结果。 最后,再对总体的概念作进一步的说明。如前所述,要检验一批灯泡的寿命,这 批灯泡构成的集合就是总体。在统计问题中,我们只是关心每个灯泡的寿命,而不是 灯泡本身,所以也可以把这批灯泡的寿命集合作为总体,这个总体是一些实数构成的 集合。一般而言,有限总体就是有限个实数的集合。如果不是针对一批特定的灯泡, 而是全面地考察某企业生产的灯泡寿命,可能的寿命是多少呢?答案是[0,十∞) 这样一个区间。或者这样看这个问题,随机地从该企业生产的灯泡中拿出一个,问这 个灯泡可能的寿命是多少,答案只能是“非负实数”,当然这个“非负实数”在实际 检验前是未知的。这时称该企业生产的灯泡寿命总体是取值于[O,十∞)区间上的 一个随机变量,这是一个无限总体。在统计推断中通常是针对无限总体的,因而通常 把总体看做随机变量。通常情况下,统计上的总体是一组观测数据,而不是一群人或 一些物品的集合。 2.样本 样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称 为样本量(sample size)。抽样的目的是根据样本提供的信息推断总体的特征。比如, 从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本,然后根据这100个 灯泡的平均使用寿命去推断这批灯泡的平均使用寿命」