第二节:统计模型与参数推断 00M0以 最小二乘估计 基本思想:保证由新估参数得到的理论值与观察值离均差的平方和值为最 小。 具体方法:为使离差平方和Q为最小,可通过求Q对待参数的偏导数,并 令其等于0,以求得参数估计量
最小二乘估计 第二节:统计模型与参数推断 7 基本思想:保证由新估参数得到的理论值与观察值离均差的平方和值为最 小。 具体方法:为使离差平方和Q为最小,可通过求Q对待参数的偏导数,并 令其等于0,以求得参数估计量
第二节:统计模型与参数推断 000八 最小二乘估计 例:用最小二乘法求总体平均数:的估计量」 若从平均数为的总体中抽得样本为1,2,,…,y,则观察值可剖分为总体平均数 u与误差e,之和,即 y=十e (12.2.1) 总体平均数:的最小二乘估计量就是使y与估计值“间的离差平方和为最小,即 -v (12.2.2) 为获得其最小值,求Q对u的导数,并令导数等于0,可得 器90w (12.2.3) 即总体平均数的估计量为 (12.2.4) 因此,算数平均数为总体平均数的最小二乘估计。 一般地,若个自变数x1,x2,x,…,xm与依变数y存在统计模型关系, y=f(x1,2,3,…,xm;01,82,…,0)十e (12.2.5) 式中,日,02,…,为待估参数。 通过n次观测(n>k)得到n组含有x,x,…,x,为(i=1,2,…,n)的数据,以 估计日1,02,…,0。其最小二乘估计值为使 0-2-2f…k:44…户 (12.2.6) 为最小的,a2,…,a。 8
最小二乘估计 第二节:统计模型与参数推断 8
第二节:统计模型与参数推断 00M以 最大似然估计 (一)似然函数 对于离散型随机变量,似然函数是多个独立事件的概率函数的乘积,该乘 积是概率函数值,它是关于总体参数的函数。 例:一只大口袋里有红、白、黑3种球,采用复置抽50次,得到红、白、 黑3种球的个数分别为12、24、14,根据多项式的理论建立似然函。 (二)最大似然估计 所谓最大似然估计就是指使似然函数值为最大以获得总体参数估计的方法。 例:求红、白、黑球实例中的最大似然估计值。 9
最大似然估计 第二节:统计模型与参数推断 9 (一)似然函数 对于离散型随机变量,似然函数是多个独立事件的概率函数的乘积,该乘 积是概率函数值,它是关于总体参数的函数。 例:一只大口袋里有红、白、黑3种球,采用复置抽50次,得到红、白、 黑3种球的个数分别为12、24、14,根据多项式的理论建立似然函。 (二)最大似然估计 所谓最大似然估计就是指使似然函数值为最大以获得总体参数估计的方法。 例:求红、白、黑球实例中 的最大似然估计值
第三节:聚类分析、主成分分析与Fisher.判别 00M八 聚类分析 (一)数据变换 1)中心化变换。 ,-,1,2,:户l2m∑/n 2)规格化变换。 号(i,(a,}一c,) 3)标准化变换。 公空到 4)对数变换。 x号lnx,x,>0 10
聚类分析 第三节:聚类分析、主成分分析与Fisher判别 10 (一)数据变换
第三节:聚类分析、主成分分析与Fisher.判别 00M 【聚类分析 (二)距离尺度函数 常用的距离度量包括几何距离、线性相关系数、非线性相关系数、互信息 等。 11
聚类分析 第三节:聚类分析、主成分分析与Fisher判别 11 (二)距离尺度函数 常用的距离度量包括几何距离、线性相关系数、非线性相关系数、互信息 等