当前位置：和泉文库 > 计算机 > 浏览文档

广东工业大学：《机器学习》课程教学资源（课件讲义）第6讲线性回归模型及其求解方法 Linear Regression Model and Its Solution

文件格式：PDF，文件大小：1.83MB，售价：9.12元

文档详细内容（约40页）

概率解释 ● 设预测结果0Tx(@与真实结果y(之间误差为e(@,即y)=0Tx(⊙+e) ●通常误差满足平均值为0的高斯分布，即正态分布。那么在一个样本片x的概率套度公式为p00O:6)品exp(-093 22 ● 模型在全部样本上预测的最大似然估计为 wT2ap(-og 2G2 o=60=ma()-》,egx9 22 从而，需要∑10y0-07x@)最小哈尔滨工业大学计算机学院刘远超

概率解释 l 设预测结果�&�(.) 与真实结果 �(.) 之间误差为�(.) ，即 �(.) = �& �(.) +�(.) l 通常误差满足平均值为0的高斯分布，即正态分布。那么在一个样本� 上�和�的概率密度公式为� � . � . ; � = ! "01 exp(− (2(&)',(+(&))# "1# ) l 模型在全部样本上预测的最大似然估计为 � � = -,-' + 1 2�� exp(− (�(,) −�& �(,) )* 2�* ) � � = �� = −�� 2�� −8,-' + (�(,) −�& �(,) )* 2�* 从而，需要 ! " ∑.3! $ (�(.) −�& �(.) )"最小哈尔滨工业大学计算机学院刘远超

求解参数 ●接下来，就是求解使得Σ沿10y@-日Tx⊙)最小的参数0。 ●解法有： ■矩阵解法。scikit--learn中的LinearRegression类使用的是矩阵解法( 有时也称为最小二乘法)。可以解出线性回归系数日。 ■梯度下降法。梯度下降(Gradient descent)是利用一阶的梯度信息找到函数局部最优解的一种方法。哈尔滨工业大学计算机学院刘远超

求解参数 l 接下来，就是求解使得 ! " ∑.3! $ (�(.) −�& �(.) )"最小的参数�。 l 解法有： n 矩阵解法。scikit-learn中的LinearRegression类使用的是矩阵解法（有时也称为最小二乘法）。可以解出线性回归系数θ。 n 梯度下降法。梯度下降（Gradient descent ）是利用一阶的梯度信息找到函数局部最优解的一种方法。哈尔滨工业大学计算机学院刘远超

参数的矩阵解法例如，设Y=B+B1X:+e,即为线性关系→e=Y-阝o-B1X 0=∑12=∑-02=∑-瓦-x02 通过使Q最小，即可确定Fo,B1。根据数学知识我们知道，函数的极值点为偏导为0的点，即器=22票G-瓦-Ax-1)=0 =221（出-。-BX)(-X)=0 ∂B1 n∑XY-∑X:∑Yi →B0= n∑X:2-(EX)2 B= ∑x:2∑Y1-ZX:∑XY1 n∑X:2-(EX)2 哈尔滨工业大学计算机学院刘远超

参数的矩阵解法例如，设�. = � G( + � G!�. + �.，即为线性关系⇒ �. = �. − � G( − � G!�. � = K�3� � �� = K�3� � (�� − � G�)� = K�3� � (�� − � G� − � G��)� 通过使� 最小，即可确定� G�，� G�。根据数学知识我们知道，函数的极值点为偏导为0的点，即 P 9: 9) ;) = 2 ∑.3! $ �. − � G( − � G!�. −1 = 0 9: 9) ;" = 2 ∑.3! $ �. − � G( − � G!�. −�. = 0 ⇒ �( = � ∑ �.�. − ∑ �. ∑ �. � ∑ �. " − (∑ �.)" �! = ∑ =& # ∑ >&'∑ =& ∑ =&>& # ∑ =& #'(∑ =&)# 哈尔滨工业大学计算机学院刘远超

参数的梯度下降求解法 Cost(0) 0(0)0(1)0(2) 0 ●梯度下降(Gradient descent)是利用一阶的梯度信息找到函数局部最优解的一种方法，也是机器学习里面常用的一种优化方法。 ● 其基本思想是，要找代价函数最小值，只需要每一步都往下走，也就是每一步都可以让误差损失函数小一点。对于线性回归，参数的更新方法一般为： =-点a.a-yog9 95=6-La8 如何求梯度？> 哈尔滨工业大学计算机学院刘远超

参数的梯度下降求解法 l 梯度下降（Gradient descent ）是利用一阶的梯度信息找到函数局部最优解的一种方法，也是机器学习里面常用的一种优化方法。 l 其基本思想是，要找代价函数最小值，只需要每一步都往下走，也就是每一步都可以让误差损失函数小一点。 l 对于线性回归，参数的更新方法一般为： �0 1 = �0 − � �� 0 = �0 − 1 � �8,-' + (ℎ% �(,) − �(,) )�0 (,) l 如何求梯度？à Cost(�) �(#) �(%) �(&) � 哈尔滨工业大学计算机学院刘远超

点击进入文档下载页（PDF格式）

共40页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

广东工业大学：《机器学习》课程教学资源（课件讲义）第5讲分类问题（4.4 朴素?叶斯分类器）
广东工业大学：《机器学习》课程教学资源（课件讲义）第5讲分类问题（4.3 ?持向量机 SVM）
广东工业大学：《机器学习》课程教学资源（课件讲义）第4讲分类问题（4.1 分类与回归问题概述 4.2 分类性能度量?法）
广东工业大学：《机器学习》课程教学资源（课件讲义）第3讲特征工程 Feature Engineering
广东工业大学：《机器学习》课程教学资源（课件讲义）第2讲模型评估与选择
广东工业大学：《机器学习》课程教学资源（课件讲义）第1讲机器学习概述
《机器学习》课程教学资源：《大语言模型》参考书籍PDF电子版 THE CHINESE BOOK FOR LARGE LANGUAGE MODELS（共十三章）
《机器学习》课程教学资源：《Python数据科学手册》参考书籍PDF电子版（2016）Python Data Science Handbook，Essential Tools for Working with Data，Jake VanderPlas
《机器学习》课程教学资源：《统计学习方法》参考书籍PDF电子版（清华大学出版社，第2版，共22章，作者：李航）
《机器学习》课程教学资源：《神经网络与深度学习》参考书籍PDF电子版 Neural Networks and Deep Learning（共十五章）
《机器学习》课程教学资源：《机器学习》参考书籍PDF电子版（清华大学出版社，著：周志华）
《机器学习》课程教学资源：《动手学深度学习》参考书籍PDF电子版 Release 2.0.0-beta0（共十六章）
广东工业大学：《机器学习》课程教学资源（课件讲义）第7讲集成学习（决策树）
广东工业大学：《机器学习》课程教学资源（课件讲义）第8讲集成学习（决策树的演化）
广东工业大学：《机器学习》课程教学资源（课件讲义）第9讲神经网络的优化（损失函数）
广东工业大学：《机器学习》课程教学资源（课件讲义）第9讲神经网络的优化（梯度下降、学习率adagrad adam、随机梯度下降、特征缩放）
广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（batch和动量Momentum NAG）
广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（自适应学习率 AdaGrad RMSProp）
广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（梯度消失和梯度爆炸BN）
广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（激活函数 dropout）
广东工业大学：《机器学习》课程教学资源（课件讲义）第11讲感知机模型与多层感知机（前馈神经网络，DNN BP）
广东工业大学：《机器学习》课程教学资源（课件讲义）第12讲卷积神经网络（卷积和池化层）
广东工业大学：《机器学习》课程教学资源（课件讲义）第12讲卷积神经网络（LeNet, AlexNet, VGG和NiN）
广东工业大学：《机器学习》课程教学资源（课件讲义）第13讲卷积神经网络计算机视觉应用（Inception, 批量归一化和残差网络ResNet）

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录