1.总体与随机样本数据与随机样本>随机样本:假设有 n个随机变量X,.…,Xn,令Xn=(X,…,Xn),则称Xn是一个样本容量(samplesize)为n的随机样本。>数据集:随机样本Xn的一个实现值称为从随机样本Xn生成的一个数据集(data set)或样本点,Xn 的一个数据集记作 xn=(xi,···,xn)>一个随机样本Xn可生成多个不同的数据集。所有可能的Xn的数据集构成随机样本Xn的样本空间。概率论与统计学
概率论与统计学 ➢ 随机样本: 假设有 𝑛 个随机变量 𝑋1, . ,𝑋𝑛,令 𝑋 𝑛 = (𝑋1, . ,𝑋𝑛),则称 𝑋 𝑛 是一个样本容量(sample size)为 𝑛 的随机样本。 ➢ 数据集: 随机样本 𝑋 𝑛 的一个实现值称为从随机样本 𝑋 𝑛 生成的一个数 据集(data set)或样本点,𝑋 𝑛 的一个数据集记作 𝑥 𝑛 = (𝑥1, · · · , 𝑥𝑛)。 ➢ 一个随机样本 𝑋 𝑛 可生成多个不同的数据集。所有可能的 𝑋 𝑛 的数据集 构成随机样本 𝑋 𝑛 的样本空间。 6 1. 总体与随机样本 数据与随机样本
1.总体与随机样本例:[抛硬市]>假设抛掷n次硬币。令X;表示抛掷第i次硬币的结果,若正面朝上则Xi=1,否则Xi=0。·Xn=(Xi,,Xn)构成一个随机样本。·抛掷n次硬币后,将获一个实数序列,如xn=(1,1,0,0,1,0,,·,1)。该序列是来自随机样本Xn的一个数据集。:若再次抛掷n次硬币,会获得一个不同的实数序列,如xn=(1,0,01,1,1,···,O),这是来自随机样本Xn的另一数据集。随机样本Xn一共可生成2n个数据集,每个数据集的样本容量均为n。概率论与统计学
概率论与统计学 例: [抛硬币] ➢ 假设抛掷 𝑛 次硬币。令 𝑋𝑖 表示抛掷第 𝑖 次硬币的结果,若正面朝上则 𝑋𝑖 = 1,否则 𝑋𝑖 = 0。 • 𝑋 𝑛 = (𝑋1, . ,𝑋𝑛) 构成一个随机样本。 • 抛掷 𝑛 次硬币后,将获一个实数序列,如 𝑥 𝑛 = (1, 1, 0, 0, 1, 0,· · · , 1)。 该序列是来自随机样本 𝑋 𝑛 的一个数据集。 • 若再次抛掷 𝑛 次硬币,会获得一个不同的实数序列,如 𝑥 𝑛 = (1, 0, 0, 1, 1, 1, · · · , 0) ,这是来自随机样本 𝑋 𝑛 的另一数据集。随机样本 𝑋 𝑛 一共可生成 2 𝑛 个数据集,每个数据集的样本容量均为 𝑛。 7 1. 总体与随机样本
1.总体与随机样本总体(population)与随机样本>若随机变量X1,,Xn互相独立(即f(x1,x2,.,xn)=In=1f(xi)=f(xi)f(x2)..f(xn)),其中每个随机变量Xi具有相同的概率分布f(x),这个概率分布f(x)就称为总体分布。>则称随机变量序列X1…,Xn为来自总体分布为f(x),样本容量为n的独立同分布(IID)的随机样本。概率论与统计学
概率论与统计学 ➢ 若 随 机 变 量 𝑋1, . ,𝑋𝑛 互相独立 ( 即 𝑓 𝑥1, 𝑥2, . . . , 𝑥𝑛 = ς𝑖=1 𝑛 𝑓 𝑥𝑖 = 𝑓 𝑥1 𝑓 𝑥2 . . . 𝑓 𝑥𝑛 ),其中每个随机变量 𝑋𝑖 具有相同的 概率分布 𝑓 𝑥 ,这个概率分布 𝑓 𝑥 就称为总体分布。 ➢ 则称随机变量序列 𝑋1, . ,𝑋𝑛 为来自总体分布为 𝑓 𝑥 ,样本容量为 𝑛 的 独立同分布 (IID) 的随机样本。 8 1. 总体与随机样本 总体 (population) 与随机样本
1.总体与随机样本例:[中国各省级行政区的GDP年增长率】>令X;表示2024年省级行政区i的GDP年增长率,则Xn=(X1,,Xn)构成了一个样本容量n=34的随机样本。·不同省级行政区的GDP年增长率符合IID的前提假设符合现实吗?√不符合。不同省份的地理位置(例如,东西部)、人口规模、发展阶段与发展水平等均存在差异>随机变量的独立同分布仅是统计学中的一个经典假设。·例如,我们可以假设不同随机变量相互独立,但不服从同样的分布。概率论与统计学
概率论与统计学 例: [中国各省级行政区的 GDP 年增长率] ➢ 令 𝑋𝑖 表示 2024 年省级行政区 𝑖 的 GDP 年增长率,则 𝑋 𝑛 = (𝑋1, . , 𝑋𝑛) 构成了一个样本容量 𝑛 = 34 的随机样本。 • 不同省级行政区的 GDP 年增长率符合 IID 的前提假设符合现实吗? ✓ 不符合。不同省份的地理位置(例如,东西部)、人口规模、发 展阶段与发展水平等均存在差异。 ➢ 随机变量的独立同分布仅是统计学中的一个经典假设。 • 例如,我们可以假设不同随机变量相互独立,但不服从同样的分布。 9 1. 总体与随机样本
1.总体与随机样本>假设Xn=(Xi,,Xn)是一个独立同分布的随机样本,且E(Xi)=μ,var(X,) = α2, i = 1,2, ...,n。总体均值:E(Xi)= J~xif(xi)dxi=μ;总体方差: var(Xi)= J(xi -μ)f(xi)dxi =2;>问题:给定一个数据集xn=(x1,···,xn),如何估计μ和α2?·通过统计量(statistic)。两个最重要的统计量:样本均值、样本方差概率论与统计学10
概率论与统计学 ➢ 假设 𝑋 𝑛 = (𝑋1, . , 𝑋𝑛) 是一个独立同分布的随机样本,且 𝐸 𝑋𝑖 = 𝜇, 𝑣𝑎𝑟 𝑋𝑖 = 𝜎 2 ,𝑖 = 1,2,. , 𝑛。 ∞− = �𝑋� ��:总体均值• ∞ 𝑥𝑖𝑓 𝑥𝑖 𝑑𝑥𝑖 = 𝜇; ∞− = �𝑋� �𝑎𝑣�:总体方差• ∞ 𝑥𝑖 − 𝜇 2𝑓 𝑥𝑖 𝑑𝑥𝑖 = 𝜎 2; ➢ 问题:给定一个数据集 𝑥 𝑛 = (𝑥1, · · · , 𝑥𝑛),如何估计 𝜇 和 𝜎 2? • 通过统计量(statistic) • 两个最重要的统计量:样本均值、样本方差 10 1. 总体与随机样本