ihangthiKeyLhortnry0dfMolealarCasandhmowatreMateril,Deoat恤etofChsmity 回归:监督学 input feature 假设,hypothesis output h(X) X y 参数, parameter 李振华制 数理统计在化学中的应用 16
李 振 华 制 造 回归:监督学习 数理统计在化学中的应用 16 X input feature 𝐡𝛚 𝐗 y 假设, hypothesis output 参数,parameter
KLaooy fMoayiveDerme of h 回归的来所 早在19世纪后期,英国生物学家Golton在研究家族 成员的相仙性时发现:虽然一般说来高个子的父代 会有高个子的子代,但是子代的身高比他们的父代 更超向一致,即若父代身材高大,则他们的子代会 超向矮一些,而若父代身材矮小,他们的子代会超 向高一些。他把子代的身高向平均值靠拢的超势称 为“向平庸的回归” Karl Pearson观察了l078个家庭中父亲身高x和儿 子身高y,建立了一个孩性方程y=33.8+0.51x 李振华制 数理统计在化学中的应用
李 振 华 制 数理统计在化学中的应用 造 回归的来历 早在19 世纪后期, 英国生物学家Golton 在研究家族 成员的相似性时发现:虽然一般说来高个子的父代 会有高个子的子代,但是子代的身高比他们的父代 更趋向一致,即若父代身材高大,则他们的子代会 趋向矮一些,而若父代身材矮小,他们的子代会趋 向高一些。他把子代的身高向平均值靠拢的趋势称 为“向平庸的回归”。 Karl Pearson 观察了1078 个家庭中父亲身高x 和儿 子身高 y, 建立了一个线性方程y = 33. 8 + 0. 51x
hargtaiKgyLabhortoryofM6dlealrCassandhmowratireMaters,Depat恤etofChtity Linear Fit 75 V=X 70 65 Equationy a b*x Valu Standar e d Error 60 a 33.8 1.83 b 0.51 0.03 58 60 62 64 66 68 70 72 74 76 Father's Height(In) 数理统计在化学中的应用 李振华制造
李振华制 数理统计在化学中的应用 造 58 60 62 64 66 68 70 72 74 76 60 65 70 75 Linear Fit y = x Son's Height (In) Father's Height (In) Equation y = a + b*x Valu e Standar d Error a 33.8 1.83 b 0.51 0.03
Ke of M viveDprimentofChmis $7.1相吴笑系和相关系数(correlation and correlation coefficient) 在科学研完中,所研完的变量之同的关素,由于 常存在着不可避免的随机误差,因此就使得变量之同 的吴系具有某种不确定性,这种变量之同魔有着相玉 影响,又不甚明了和肯定的关系,在镜计上就称为相 关关素。相吴吴票与岛熟关素之同异设有严格的界限 o 两个变量之间的相关关素,地达到一定的紧密程意 时,就一定会发貌它们之间有着确定的品数吴系。在 镜计学上研宪变量之同是香存在一定的相吴吴素,就 称为相关分析。相关分析的目的就是要求出相关素数 李振华制 数理统计在化学中的应用
李 振 华 制 数理统计在化学中的应用 造 $7.1 相关关系和相关系数(correlation and correlation coefficient) 在科学研究中,所研究的变量之间的关系,由于 常存在着不可避免的随机误差,因此就使得变量之间 的关系具有某种不确定性,这种变量之间既有着相互 影响,又不甚明了和肯定的关系,在统计上就称为相 关关系。相关关系与函数关系之间并没有严格的界限 。两个变量之间的相关关系,如达到一定的紧密程度 时,就一定会发现它们之间有着确定的函数关系。在 统计学上研究变量之间是否存在一定的相关关系,就 称为相关分析。相关分析的目的就是要求出相关系数
ihangtaiKyLahorthryofMolearChsadhnoztireMhei冰,Deoat恤tofChmiy 相关系数 统计上常用一变量对另一变量的回归方程的离散程度 来表示相关系数,并用字母下来表示,定义如下: r2=1-0/∑(y-)月 Q0=∑(y-)月 Q:残余方差 y的回归估计值 从上式可见,残余差方和Q越小,回归方程的离散程 度越小,回归系数越接近1,也就越意味着存在着确 定的画数关系。 振华制 数理统计在化学中的应用
李 振 华 制 数理统计在化学中的应用 造 相关系数 统计上常用一变量对另一变量的回归方程的离散程度 来表示相关系数,并用字母 r 来表示,定义如下: 从上式可见,残余差方和 Q 越小,回归方程的离散程 度越小,回归系数越接近 1 ,也就越意味着存在着确 定的函数关系。2 2 1 / ( ) i r Q y y 2 ( ) ˆ Q y y i i Q: 残余方差 y的回归估计值