答:算术平均数,指资料中各观测值的总和除以观测个数的所得的商。性质:(1) 离均差平方和为最小(2)离均差之和为零。 3.5简述变量的分类 答:(1)变量按其性质可分为连续变量和非连续变量。连续变量表示在变量范围内 可抽出某一范围的所有值,这种变量是连续的:非连续变量表示在变量数列中仅能 取得固定值。(2)变量又可分为定量变量和定性变量。 3.6简述标准误和标准差的区别和联系。 ∑Y- S= 答:标准差:变数变异程度的度量。 n-1 标准误:统计数变异程度的度量。如号=s/厅 第四章:理论分布与抽样分布 4.1事件的概率具有那些基本性质? 答:概率的基本性质:(1)对于任何事件A0<=P(A)<=1:(2)必然事件概率为1 (3)不可能事件概率为0。 4.2正态分布的密度曲线有何特点?μ和·对正态分布曲线有何影响? 答:正态分布曲线的特征:(1)正态分布密度曲线是单峰、对称的悬钟形曲线,对 称轴为=u(2)f(x)在x=u处达到极大,极大值F(山)=1/「G(2π)1/2](3) (x)是非负函数,以x轴为渐进线,分布从-∞至4)曲线在x=μ士处各有 个拐点,即曲线在(-∞,μ-0)和(μ+0,+∞)区间上是下凸的,在[μ-0, μ+σ]区间上是上凸的(5)正态分布有两个参数,即平均数μ和标准差。μ 确定正态分布在X轴上的中心位置,·确定正态分布的变异度。 4.3标准误与标准差有何联系与区别? 答:(1)标准误反映同一个总体内抽样所得的样本平均数间的差异。标准误的功用: 衡量资料的变异性,估计抽样误差。 (2)样本标准差估计同一个总体内各个个体,由于立地环境条件不同而产生的变 异有多大
答:算术平均数,指资料中各观测值的总和除以观测个数的所得的商。性质:(1) 离均差平方和为最小(2)离均差之和为零。 3.5 简述变量的分类: 答:(1)变量按其性质可分为连续变量和非连续变量。连续变量表示在变量范围内 可抽出某一范围的所有值,这种变量是连续的;非连续变量表示在变量数列中仅能 取得固定值。(2)变量又可分为定量变量和定性变量。 3.6 简述标准误和标准差的区别和联系。 答:标准差:变数变异程度的度量。 2 ( ) 1 Y y s n − = − 。 标准误:统计数变异程度的度量。如 / y s s n = 第四章:理论分布与抽样分布 4.1 事件的概率具有那些基本性质? 答:概率的基本性质:(1)对于任何事件 A 0<=P(A)<=1;(2)必然事件概率为 1 (3)不可能事件概率为 0 。 4.2 正态分布的密度曲线有何特点? μ 和 σ 对正态分布曲线有何影响 ? 答:正态分布曲线的特征:(1)正态分布密度曲线是单峰、对称的悬钟形曲线,对 称轴为 x=μ(2)f(x)在 x=μ 处达到极大,极大值 f(μ)=1/[σ(2π)1/2](3) f(x)是非负函数,以 x 轴为渐进线,分布从-∞至 4)曲线在 x=μ±σ 处各有一 个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间上是下凸的,在[μ-σ, μ+σ]区间上是上凸的(5)正态分布有两个参数,即平均数 μ 和标准差 σ。μ 确定正态分布在 X 轴上的中心位置,σ 确定正态分布的变异度。 4.3 标准误与标准差有何联系与区别? 答:(1)标准误反映同一个总体内抽样所得的样本平均数间的差异。标准误的功用: 衡量资料的变异性,估计抽样误差。 (2)样本标准差估计同一个总体内各个个体,由于立地环境条件不同而产生的变 异有多大
4.4样本平均数抽样总体与原始总体的两个参数间有何联系? 答:样本平均数分布的平均数4:、标准差σ,与其原总体平均数μ、标准差 。的关系为: 4=A n 4.5什么是正态分布?什么是标准正态分布? 答:正态分布或称高斯(Gauss)分布,是连续性随机变量的一种最重要的理论分布。 标准正态分布:平均数μ=0,方差。2=1的正态分布。 4.6什么是二项总体与二项分布? 答:二项总体:试验或调查中最常见的一类随机变数是整个总体的各组或单位可以 根据某种性状的出现与否而分为两组。这类变数均属间断性随机变数,其总体中包 含两项,即:非此即彼的两项,它们构成的总体称为二项总体。通常将二项总体中 的“此”事件以变量“1”表示,具概率p:将“彼”事件以变量“0”表示,具概 率0。因而二项总体又称为0、1总体,其慨率则显然有:D+a=1。 二项分布:如果从二项总体抽取个个体,可能得到y个个体属于“此”,而属 于“彼”的个体为一y。由于是随机独立地从总体中抽取个体的,每一次抽取的个 体均有可能属于“此”,也可能属于“彼”,那么得到的y个“此”个体的数目 可能为0、1、2、·、n个。此处将y作为间断性资料的变量,y共有n+1种取值, 这+1种取值各有其概率,因而由变量及其概率就构成了一个分布,这个分布叫 做二项式概率分布,简称二项式分布或二项分布,即为间断性变数总体的理论分布。 第五章统计假设测验及参数的区间估计 5.1什么是假设检验?假设检验的步骤? 答:假设检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体 提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算作出在一定意 概率义上应该接受的那种假设的推断。其测验的步骤如下:1)对样本所属总体提 出无效假设H和备择假设H:2)确定检验的显著水平ā;3)在HO正确的前 提下,根据抽样分布的统计数,进行假设检验的概率计算:4)根据概率显著水平 α的临界值,进行差异是否显著的推断。 5.2设立无效假设的原则是什么? 答:是有实际意义的:据之可以算出因抽样误差而获得样本结果的概率。 5.3什么是小概率原理?它在假设检验中有何作用?
4.4 样本平均数抽样总体与原始总体的两个参数间有何联系? 答:样本平均数分布的平均数 、标准差 与其原总体平均数 、标准差 的关系为: 4.5 什么是正态分布 ? 什么是标准正态分布 ? 答:正态分布或称高斯(Gauss)分布,是连续性随机变量的一种最重要的理论分布。 标准正态分布:平均数 μ=0,方差 σ2 =1 的正态分布。 4.6 什么是二项总体与二项分布? 答:二项总体:试验或调查中最常见的一类随机变数是整个总体的各组或单位可以 根据某种性状的出现与否而分为两组。这类变数均属间断性随机变数,其总体中包 含两项,即:非此即彼的两项,它们构成的总体称为二项总体。通常将二项总体中 的“此”事件以变量“1”表示,具概率 p;将“彼”事件以变量“0”表示,具概 率 q。因而二项总体又称为 0、1 总体,其概率则显然有:p+q=1。 二项分布:如果从二项总体抽取 n 个个体,可能得到 y 个个体属于“此”,而属 于“彼”的个体为 n-y。由于是随机独立地从总体中抽取个体的,每一次抽取的个 体均有可能属于“此”,也可能属于“彼”,那么得到的 y 个“此”个体的数目 可能为 0、1、2、.、n 个。此处将 y 作为间断性资料的变量,y 共有 n+1 种取值, 这 n+1 种取值各有其概率,因而由变量及其概率就构成了一个分布,这个分布叫 做二项式概率分布,简称二项式分布或二项分布,即为间断性变数总体的理论分布。 第五章 统计假设测验及参数的区间估计 5.1 什么是假设检验 ? 假设检验的步骤? 答:假设检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体 提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算作出在一定意 概率义上应该接受的那种假设的推断。其测验的步骤如下: 1)对样本所属总体提 出无效假设 H0和备择假设 HA; 2) 确定检验的显著水平 α; 3) 在 H0 正确的前 提下,根据抽样分布的统计数,进行假设检验的概率计算; 4) 根据概率显著水平 α 的临界值,进行差异是否显著的推断。 5.2 设立无效假设的原则是什么? 答:是有实际意义的;据之可以算出因抽样误差而获得样本结果的概率。 5.3 什么是小概率原理 ? 它在假设检验中有何作用 ? x x x = n x 2 2 = n x =
答:如果假设一些条件,并在假设的条件下能够准确的算出事件A出现的概率 a为很小,则在假设条件下的n次重复试验中事件A将按预定的概率发生,而在 一次试验中则几乎不可能发生。小概率事件实际不可能原理是统计学上进行假设 实验的基础依据。 5.4假设检验中的两类错误是什么?如何降低犯两类错误的概率? 答:假设检验中的两类错误:第一类错误:H。本来是直,而作出了拒绝的判断所犯 而作出了接受的 降低两类错误的措施:(1)在样本容量一定时,提高显著水平,可以减少犯第 类错误的概率,但同时增大了犯第二类错误的概率。(2)在和显著水平相同的条 件下,真正的总体平均数μ和假设的平均数的相差越大,则犯第二类错误的概 率越小。(3)为了降低犯两类错误的概率,需采用 个较低的显著水平,如ā 0.05 同时适当增加样本容量。(4)如显著水平一定,则改进试验技术和增加样本容量可 以有效的降低犯两类错误的概率。 5.5什么叫区间估计?什么叫点估计?置信度与区间估计有什么关系? 答:区间估计是在一定概率保证下,估计参数可能在内的一个范围或区间(估计 出一个范围或区间以能够覆盖参数)。点估计是是以样本的统计数估计总体的相 应参数。区间估计是要根据样本来确定一个区间L1,L2],保证参数落在这个区间 内的概率称为置信度或胃信概率,以P=1-ā表示。其中「L1,L2]称为该参数的置 信区间,1-ā为此区间的置信度。 5.6、两尾检验、一尾检验各在什么条件下应用 答:统计假设测验中H:=山具有两个否定区,H:μ≠4,这类测验称两尾测 验,在假设测验中所考虑的概率为左右两尾概率之和。在假设测验中所考虑的概 率只用一尾概率的测验称为一尾测验。 5.7什么是小概率事件的实际不可能性原理? 答:若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件 在统计学上,把小概率事件再一次试验中堪称是实际不可能发生的时间称为小概 率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能原理是统计 学上进行假设实验的基础依据 5.8简述t分布曲线的特点。 答:·t分布曲线的特点(1)t分布受自由度的制约,每一个自由度都有一条t分 布密度曲线(2)t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布 密度函数取得最大值(3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾 部稍高而平
答:如果假设一些条件,并在假设的条件下能够准确的算出事件 A 出现的概率 α 为很小,则在假设条件下的 n 次重复试验中事件 A 将按预定的概率发生,而在 一次试验中则几乎不可能发生。小概率事件实际不可能原理是统计学上进行假设 实验的基础依据。 5.4 假设检验中的两类错误是什么 ? 如何降低犯两类错误的概率? 答:假设检验中的两类错误:第一类错误:H0 本来是真,而作出了拒绝的判断所犯 的错误称”弃真”错误或 α 错误;第二类错误:H0本来是不真,而作出了接受的 判断所犯的错误称”取伪”错误或 β 错误。 降低两类错误的措施:(1)在样本容量 n 一定时,提高显著水平,可以减少犯第一 类错误的概率,但同时增大了犯第二类错误的概率。(2)在 n 和显著水平相同的条 件下,真正的总体平均数 和假设的平均数 0的相差越大,则犯第二类错误的概 率越小。(3)为了降低犯两类错误的概率,需采用 一个较低的显著水平,如 α=0.05。 同时适当增加样本容量。(4)如显著水平一定,则改进试验技术和增加样本容量可 以有效的降低犯两类错误的概率。 5.5 什么叫区间估计 ? 什么叫点估计 ? 置信度与区间估计有什么关系 ? 答:区间估计是在一定概率保证下,估计参数可能在内的一个范围或区间 (估计 出一个范围或区间以能够覆盖参数) 。点估计是是以样本的统计数估计总体的相 应参数。区间估计是要根据样本来确定一个区间[L1 ,L2],保证参数落在这个区间 内的概率称为置信度或置信概率,以 P=1-α 表示。其中[L1 ,L2]称为该参数的置 信区间,1-α 为此区间的置信度。 5.6、两尾检验、一尾检验各在什么条件下应用? 答:统计假设测验中 H0: µ=µ0具有两个否定区,HA: µ≠ µ0,这类测验称两尾测 验,在假设测验中所考虑的概率为左右两尾概率之和。在假设测验中所考虑的概 率只用一尾概率的测验称为一尾测验。 5.7 什么是小概率事件的实际不可能性原理? 答:若随机事件的概率很小,例如小于 0.05、0.01、0.001,称之为小概率事件。 在统计学上,把小概率事件再一次试验中堪称是实际不可能发生的时间称为小概 率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能原理是统计 学上进行假设实验的基础依据。 5.8 简述 t 分布曲线的特点。 答:.t 分布曲线的特点(1)t 分布受自由度的制约,每一个自由度都有一条 t 分 布密度曲线(2)t 分布密度曲线以纵轴为对称轴,左右对称,且在 t=0 时,分布 密度函数取得最大值(3)与标准正态分布曲线相比,t 分布曲线顶部略低,两尾 部稍高而平