数据统计描述中的概念 >6、缺失值 ◆概念 数据采集中获得的“空白”或者“不合理”数据 ◆对数据分析的影响 影响分析结果的准确性 ◆处理 排除 不允许带缺失值的个案参与运算 预处理 对缺失值数据进行适当填充
一、数据统计描述中的概念 ➢ 6、缺失值 ◆概念 数据采集中获得的“空白”或者“不合理”数据 ◆对数据分析的影响 影响分析结果的准确性 ◆处理 排除 不允许带缺失值的个案参与运算 预处理 对缺失值数据进行适当填充
数据统计描述中的概念 >7数据的分布形态 正态分布 是一种理想化的分布形态,也叫高斯分布 。若随机变量服从一个位置参数为u、尺度参数为6的概率分 布,且其概率密度函数满足 f(x)=_1 2 x exp 2σ 20 则这个随机变量就称为正态随机变量,正态随机变量服从 的分布就称为正态分布 理想化的正态分布满足u=0,6=1。U是位置,是标准差
一、数据统计描述中的概念 ➢ 7. 数据的分布形态 正态分布 是一种理想化的分布形态,也叫高斯分布。 若随机变量服从一个位置参数为u、尺度参数为ð的概率分 布,且其概率密度函数满足: 则这个随机变量就称为正态随机变量,正态随机变量服从 的分布就称为正态分布。 理想化的正态分布满足u=0, ð =1。U是位置,ð是标准差
数据统计描述中的概念 2500-19·-1· 1·192% 1.925 6827% 6827 9500% 9900 95m 9900% 正态分布面积图1 正态分布面积图2
一、数据统计描述中的概念
数据统计描述中的概念 正态分布的标记变量 偏度 描述统计数据分布形态对称性的统计量 √相对于正态分布(或t分布形态) 内涵: 偏度大于0,为正偏——向右偏 偏度小于0,为负偏——向左偏 峰度 描述变量值分布形态陡缓程度的统计量。 √相对于正态分布 内涵: 其值与正态分布标准曲线对比。 大于0,更陡;小于0;较缓
一、数据统计描述中的概念 正态分布的标记变量 偏度 ✓描述统计数据分布形态对称性的统计量 ✓相对于正态分布(或t分布形态) ✓内涵: • 偏度大于0,为正偏——向右偏 • 偏度小于0,为负偏——向左偏 峰度 ✓描述变量值分布形态陡缓程度的统计量。 ✓相对于正态分布 ✓内涵: • 其值与正态分布标准曲线对比。 • 大于0,更陡;小于0;较缓
数据统计描述中的概念 指数分布 在统计学中,指某一时刻事件发生的概率满足以“入”为 控制量、时间t为自变量的指数关系 指数分布 设连续型随机变量X的密度函数为f(n)=enx≥0 0x<0 则称X服从参数为的指数分布,这里>0为常数 其分布函数为F(x)=f(o)t=1-e-nx≥0 0x<0
一、数据统计描述中的概念 指数分布 在统计学中,指某一时刻事件发生的概率满足以“入”为 控制量、时间t为自变量的指数关系