第六讲:参数估计 6.2 区间估计 1 6.2.1置信区间 2 6.2.2 置信界.· 10 6.2.3 确定样本大小 11 Previous Next First Last Back Forward 1
第六讲: 参数估计 6.2 区间估计 . . . . . . . . . . . . . . . . . . . . 1 6.2.1 置信区间 . . . . . . . . . . . . . . . . 2 6.2.2 置信界 . . . . . . . . . . . . . . . . . . 10 6.2.3 确定样本大小 . . . . . . . . . . . . . . 11 Previous Next First Last Back Forward 1
6.2 区间估计 对于一个未知量,人们在测量和计算时,常不以得到近似值为满 足,还需要估计误差,及要求知道近似值的精确程度(亦即所求真值所 在的范围).类似的,对于未知的参数0,除了求出它的点估计0外, 我们还希望估计出一个范围,并希望知道这个范围包含参数0真值得 可信程度.这样的范围通常以区间形式给出,同时还给出此区间包含 真值的可信程度.这种形式的估计称为区间估计 比如你估计月花费支出是500,我们相信多少会有误差,但是误差 TExample 有多大?单从你提出的500这个数字还给不出什么信息,若你给出估 计支出是400-600之间,则人们相信你在作出这估计时,已把可能出 现的误差考虑到了,多少给人们以更大的信任感.因此区间估计也是 常用的一种估计方式。 ↓Example Previous Next First Last Back Forward
6.2 区间估计 对于一个未知量, 人们在测量和计算时, 常不以得到近似值为满 足, 还需要估计误差, 及要求知道近似值的精确程度 (亦即所求真值所 在的范围). 类似的, 对于未知的参数 θ, 除了求出它的点估计 ˆθ 外, 我们还希望估计出一个范围, 并希望知道这个范围包含参数 θ 真值得 可信程度. 这样的范围通常以区间形式给出, 同时还给出此区间包含 真值的可信程度. 这种形式的估计称为区间估计. ↑Example 比如你估计月花费支出是 500, 我们相信多少会有误差, 但是误差 有多大? 单从你提出的 500 这个数字还给不出什么信息, 若你给出估 计支出是 400-600 之间, 则人们相信你在作出这估计时, 已把可能出 现的误差考虑到了, 多少给人们以更大的信任感. 因此区间估计也是 常用的一种估计方式. ↓Example Previous Next First Last Back Forward 1
现在最流行的一种区间估计理论是J.Neyman在上世纪30年 代建立起来的.他的理论的基本概念很简单,为表达方便,我们暂时假 定总体分布只包含一个未知参数0,且要估计的就是0本身.如果总 体分布中包含若干位置参数01,·,0k,而要估计的是g(01,·,), 则基本概念和方法并无不同.这在后面的例子里可以看出 6.2.1置信区间 Neyman建立起来的区间估计也叫置信区间,字面上的意思是: 对该区间能包含未知参数日可置信到何种程度, 假设X1,·,Xn是从该总体中抽取的样本,所谓(一维未知)0 的区间估计,就是要 ·寻求统计量(X1,·,Xn)<(X1,·,Xn)所构成的区间 [但,可. ·该区间满足一定的要求 Previous Next First Last Back Forward 2
现在最流行的一种区间估计理论是 J. Neyman 在上世纪 30 年 代建立起来的. 他的理论的基本概念很简单, 为表达方便, 我们暂时假 定总体分布只包含一个未知参数 θ, 且要估计的就是 θ 本身. 如果总 体分布中包含若干位置参数 θ1, · · · , θk, 而要估计的是 g(θ1, · · · , θk), 则基本概念和方法并无不同. 这在后面的例子里可以看出. 6.2.1 置信区间 Neyman 建立起来的区间估计也叫置信区间, 字面上的意思是: 对该区间能包含未知参数 θ 可置信到何种程度. 假设 X1, · · · , Xn 是从该总体中抽取的样本, 所谓 (一维未知)θ 的区间估计, 就是要 • 寻求统计量 θ(X1, · · · , Xn) < ¯θ(X1, · · · , Xn) 所构成的区间 [θ, ¯θ]. • 该区间满足一定的要求 Previous Next First Last Back Forward 2
不难理解,这里有两个要求 ·0以很大概率被包含在区间[但,可内,也就是说 Pa(0≤0≤0)=1-a 尽可能大,即要求估计尽量可靠 ·估计的精度要尽可能高,比如要求区间【但,可要尽可能的短,或 者某种能体现这个要求的其他准则。 比如估计一个人的年龄,如[30,35),我们自然希望这个人的年龄有很 大把握在这个区间之内,并且希望这个区间不能太长.如果估计是 [10,90],当然可靠了,但是精度太差,用处不大 但这两个要求是相互矛盾的,因此区间估计的原则是在已有的 样本资源限制下,找出更好的估计方法以尽量提高可靠性和精度。 Neyman提出了广泛接受的准则:先保证可靠性,在此前提下尽可能 提高精度。为此,引入如下定义: Previous Next First Last Back Forward 3
不难理解, 这里有两个要求 • θ 以很大概率被包含在区间 [θ, ¯θ] 内, 也就是说 Pθ(θ ≤ θ ≤ ¯θ) = 1 − α 尽可能大, 即要求估计尽量可靠. • 估计的精度要尽可能高,比如要求区间 [θ, ¯θ] 要尽可能的短, 或 者某种能体现这个要求的其他准则。 比如估计一个人的年龄, 如 [30,35], 我们自然希望这个人的年龄有很 大把握在这个区间之内, 并且希望这个区间不能太长. 如果估计是 [10,90], 当然可靠了, 但是精度太差, 用处不大. 但这两个要求是相互矛盾的,因此区间估计的原则是在已有的 样本资源限制下,找出更好的估计方法以尽量提高可靠性和精度。 Neyman 提出了广泛接受的准则:先保证可靠性,在此前提下尽可能 提高精度。为此,引入如下定义: Previous Next First Last Back Forward 3
设总体分布F(x,)含有一个或多个未知的参数0,0∈日, 对给定的值a,(0<a<1),若由样本X1,…,Xn确定的两 个统计量百=(X1,…,Xn)和且=(X1,…,Xn),满足 Definition Pa(g≤0≤0=1-a t0∈日 称1-α为置信系数或置信水平,而称[但,可为0的置信水 平为1-a的置信区间。 置信区间就是在给定的置信水平之下,去寻找有优良精度的区 间。 一般,我们首先寻求参数0的一个估计(多数是基于其充分统计 量构造的),然后基于此估计量构造参数0的置信区间,介绍如下: Previous Next First Last Back Forward 4
设总体分布 F(x, θ) 含有一个或多个未知的参数 θ,θ ∈ Θ, 对给定的值 α,(0 < α < 1),若由样本 X1, · · · , Xn 确定的两 个统计量 ¯θ = ¯θ(X1, · · · , Xn) 和 θ = θ(X1, · · · , Xn),满足 Pθ(θ ≤ θ ≤ ¯θ) = 1 − α ∀ θ ∈ Θ 称 1 − α 为置信系数或置信水平,而称 [θ, ¯θ] 为 θ 的置信水 平为 1 − α 的置信区间。 Definition 置信区间就是在给定的置信水平之下,去寻找有优良精度的区 间。 一般,我们首先寻求参数 θ 的一个估计 (多数是基于其充分统计 量构造的),然后基于此估计量构造参数 θ 的置信区间,介绍如下: Previous Next First Last Back Forward 4