当前位置：和泉文库 > 计算机 > 浏览文档

广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（激活函数 dropout）

文件格式：PDF，文件大小：2.38MB，售价：11.6元

共52页，可试读18页，点击往前阅读 ↑↑

文档详细内容（约52页）

ReLU A Thinner linear network a=0 Do not have smaller gradients

ReLU 1 x 2 x 1 y 2 y A Thinner linear network Do not have smaller gradients 𝑧 𝑎 𝑎 = 𝑧 𝑎 = 0

ReLU-variant Leaky ReLU Parametric ReLU 0 a a=0.01z a az a also learned by gradient descent

ReLU - variant 𝑧 𝑎 𝑎 = 𝑧 𝑎 = 0.01𝑧 𝐿𝑒𝑎𝑘𝑦 𝑅𝑒𝐿𝑈 𝑧 𝑎 𝑎 = 𝑧 𝑎 = 𝛼𝑧 𝑃𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑖𝑐 𝑅𝑒𝐿𝑈 α also learned by gradient descent

Maxout ReLU is a special cases of Maxout Learnable activation function [lan J.Goodfellow,ICML'13] 5 neuron Input Max Max 2 +-2 +一4 Max Max 4 +3 You can have more than 2 elements in a group

Maxout • Learnable activation function [Ian J. Goodfellow, ICML’13] Max 1 x 2 x Input Max + 5 + 7 + −1 + 1 7 1 Max Max + 1 + 2 + 4 + 3 2 4 ReLU is a special cases of Maxout You can have more than 2 elements in a group. neuron

Maxout ReLU is a special cases of Maxout Z +Z1 Input w ReLU a Input w Max →a *Z21 maxz ,z2 区wx+0 Z1=Wx +b Z2=0

Maxout Max x1 Input + 𝑧1 + 𝑧2 𝑎 𝑚𝑎𝑥 𝑧1 , 𝑧2 𝑤 𝑏 0 0 𝑥 𝑧 = 𝑤𝑥 + 𝑏 𝑎 x1 Input ReLU 𝑧 𝑤 𝑏 𝑎 𝑥 𝑧1 = 𝑤𝑥 + 𝑏 𝑎 𝑧2 =0 ReLU is a special cases of Maxout

Maxout More than ReLU Z Input W ReLU a Input W Max →a 12 maxtz ,z2 Learnable Activation Function a z=wx+b Z1=Wx +b X Z2 =w'x +b

Maxout Max x1 Input + 𝑧1 + 𝑧2 𝑎 𝑚𝑎𝑥 𝑧1 , 𝑧2 𝑤 𝑏 𝑤′ 𝑏 ′ 𝑥 𝑧 = 𝑤𝑥 + 𝑏 𝑎 x1 Input ReLU 𝑧 𝑤 𝑏 𝑎 𝑥 𝑧1 = 𝑤𝑥 + 𝑏 𝑎 𝑧2 = 𝑤′𝑥 + 𝑏 ′ Learnable Activation Function More than ReLU

点击进入文档下载页（PDF格式）

共52页，可试读18页，点击继续阅读 ↓↓

您可能感兴趣的文档

广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（梯度消失和梯度爆炸BN）
广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（自适应学习率 AdaGrad RMSProp）
广东工业大学：《机器学习》课程教学资源（课件讲义）第10讲神经网络的优化（batch和动量Momentum NAG）
广东工业大学：《机器学习》课程教学资源（课件讲义）第9讲神经网络的优化（梯度下降、学习率adagrad adam、随机梯度下降、特征缩放）
广东工业大学：《机器学习》课程教学资源（课件讲义）第9讲神经网络的优化（损失函数）
广东工业大学：《机器学习》课程教学资源（课件讲义）第8讲集成学习（决策树的演化）
广东工业大学：《机器学习》课程教学资源（课件讲义）第7讲集成学习（决策树）
广东工业大学：《机器学习》课程教学资源（课件讲义）第6讲线性回归模型及其求解方法 Linear Regression Model and Its Solution
广东工业大学：《机器学习》课程教学资源（课件讲义）第5讲分类问题（4.4 朴素?叶斯分类器）
广东工业大学：《机器学习》课程教学资源（课件讲义）第5讲分类问题（4.3 ?持向量机 SVM）
广东工业大学：《机器学习》课程教学资源（课件讲义）第4讲分类问题（4.1 分类与回归问题概述 4.2 分类性能度量?法）
广东工业大学：《机器学习》课程教学资源（课件讲义）第3讲特征工程 Feature Engineering
广东工业大学：《机器学习》课程教学资源（课件讲义）第11讲感知机模型与多层感知机（前馈神经网络，DNN BP）
广东工业大学：《机器学习》课程教学资源（课件讲义）第12讲卷积神经网络（卷积和池化层）
广东工业大学：《机器学习》课程教学资源（课件讲义）第12讲卷积神经网络（LeNet, AlexNet, VGG和NiN）
广东工业大学：《机器学习》课程教学资源（课件讲义）第13讲卷积神经网络计算机视觉应用（Inception, 批量归一化和残差网络ResNet）
广东工业大学：《机器学习》课程教学资源（课件讲义）第13讲卷积神经网络计算机视觉应用（目标检测，计算机视觉训练技巧）
广东工业大学：《机器学习》课程教学资源（课件讲义）第14讲循环神经网络（RNN）
广东工业大学：《机器学习》课程教学资源（课件讲义）第15讲无监督学习——降维深度学习可视化（PCA Kmeans）
广东工业大学：《机器学习》课程教学资源（课件讲义）第15讲无监督学习——降维深度学习可视化（Neighbor Embedding，LLE T-SNE）
广东工业大学：《机器学习》课程教学资源（PPT讲稿）第16讲现代循环神经网络（高级循环神经网络）
广东工业大学：《机器学习》课程教学资源（PPT讲稿）第16讲现代循环神经网络（编码器解码器，Seq2seq模型，束搜索）
广东工业大学：《机器学习》课程教学资源（PPT讲稿）第16讲现代循环神经网络（嵌入向量, 词嵌入, 子词嵌入, 全局向量的词嵌入）
广东工业大学：《机器学习》课程教学资源（PPT讲稿）第17讲注意力机制（概述）

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录