当前位置：和泉文库 > 计算机 > 《机器学习》课程教学资源：《神经网络与深度学习》参考书籍PDF电子版 Neural Networks and Deep Learning（共十五章）

《机器学习》课程教学资源：《神经网络与深度学习》参考书籍PDF电子版 Neural Networks and Deep Learning（共十五章）

第1章绪论 2 第2章机器学习概述 22 第3章线性模型 53 第4章前馈神经网络 78 第5章卷积神经网络 105 第6章循环神经网络 129 第7章网络优化与正则化 153 第8章注意力机制与外部记忆 192 第9章无监督学习 213 第10章模型独立的学习方式 228 第11章概率图模型 253 第12章深度信念网络 288 第13章深度生成模型 308 第14章深度强化学习 329 第15章序列生成模型 355

文件格式：PDF，文件大小：6.25MB，售价：47.16元

共444页，可试读40页，点击往前阅读 ↑↑

文档详细内容（约444页）

1.6本书的知识体系 2021年5月18日解释性差等缺点更加凸显，因此神经网络的研究又一次陷入低潮。第五阶段：深度学习的崛起第五阶段为从2006年开始至今，在这一时期研究者逐渐掌握了训练深层神经网络的方法，使得神经网络重新崛起 [Hinton et al,.20O6]通过逐层预训练来学习一个深度信念网络，并将其权深度信念网参见重作为一个多层前馈神经网络的初始化权重，再用反向传播算法进行精调。这第123节种“预训练+精调”的方式可以有效地解决深度神经网络难以训练的问题.随着深度神经网络在语音识别[Hinton et al,2012和图像分类[Krizhevsky et al. 2012]等任务上的巨大成功，以神经网络为基础的深度学习迅速崛起.近年来，随着大规模并行计算以及GPU设备的普及，计算机的计算能力得以大幅提高.此外，可供机器学习的数据规模也越来越大.在强大的计算能力和海量的数据规模支持下，计算机已经可以端到端地训练一个大规模神经网络，不再需要借助预训练的方式.各大科技公司都投入巨资研究深度学习，神经网络迎来第三次高潮 1.6本书的知识体系本书主要对神经网络和深度学习所涉及的知识提出一个较全面的基础性介绍.本书的知识体系如图1.6所示，可以分为三大块：机器学习、神经网络和概率图模型效机确新 EM算法保变信念路模型推断学习变分自编码器一--…→密度估计全连接网路概率图模型无监督学习-自编码器] 前馈网络聚类☐ 图网络一模型神经网络机器学习强化学习记忆网路分类酷环同路监督学习回归记忆增网路模型学习准则结构化学习线性模型医我性松型D优化算法随机梯度下用大后估计图1.6本书的知识体系本书的知识体系在各章节中的安排如下：机器学习机器学习可以分为监督学习、无监督学习和强化学习.第2章对机器学习进行概述，使读者能够了解机器学习的基本概念以及三要素：模型、学习准 https://nndl.github.io/

1.6 本书的知识体系 2021 年 5 月 18 日 16 解释性差等缺点更加凸显，因此神经网络的研究又一次陷入低潮．第五阶段：深度学习的崛起第五阶段为从 2006 年开始至今，在这一时期研究者逐渐掌握了训练深层神经网络的方法，使得神经网络重新崛起． [Hinton et al., 2006] 通过逐层预训练来学习一个深度信念网络，深度信念网络参见第12.3节．并将其权重作为一个多层前馈神经网络的初始化权重，再用反向传播算法进行精调．这种“预训练 + 精调”的方式可以有效地解决深度神经网络难以训练的问题．随着深度神经网络在语音识别[Hinton et al., 2012]和图像分类[Krizhevsky et al., 2012]等任务上的巨大成功，以神经网络为基础的深度学习迅速崛起．近年来，随着大规模并行计算以及 GPU 设备的普及，计算机的计算能力得以大幅提高．此外，可供机器学习的数据规模也越来越大．在强大的计算能力和海量的数据规模支持下，计算机已经可以端到端地训练一个大规模神经网络，不再需要借助预训练的方式．各大科技公司都投入巨资研究深度学习，神经网络迎来第三次高潮． 1.6 本书的知识体系本书主要对神经网络和深度学习所涉及的知识提出一个较全面的基础性介绍．本书的知识体系如图1.6所示，可以分为三大块：机器学习、神经网络和概率图模型．概率图模型模型神经网络机器学习前馈网络全连接网络卷积网络图网络记忆网络循环网络记忆增强网络模型要素线性模型非线性模型优化算法随机梯度下降学习准则结构风险最小化最大似然估计最大后验估计类型监督学习分类回归结构化学习强化学习无监督学习密度估计变分自编码器生成对抗网络深度信念网络玻尔兹曼机自编码器聚类模型有向图无向图学习 EM 算法推断精确推断近似推断图 1.6 本书的知识体系本书的知识体系在各章节中的安排如下：机器学习机器学习可以分为监督学习、无监督学习和强化学习．第2章对机器学习进行概述，使读者能够了解机器学习的基本概念以及三要素：模型、学习准 https://nndl.github.io/

17常用的深度学习框架 2021年5月18日 17 则和优化算法，并以线性回归为例来讲述不同学习算法之间的关联.第3章主要介绍一些基本的线性模型.这两章都以监督学习为主进行介绍.第9章介绍了一些无监督学习方法，包括无监督特征学习和概率密度估计.第10章中介绍了一些和模型无关的机器学习方法.第14章介绍了深度强化学习的知识. 神经网络神经网络作为一类非线性的机器学习模型，可以更好地实现输入和虽然这里将神经同络输出之间的映射.第4章到第6章分别讲述三种主要的神经网络模型：前馈神经网体上合为三种络、卷积神经网络和循环神经网络.第6章也简单介绍了一种更一般性的网络：图类型.但是大多数网络都是复合型钻构，即一网络.第7章介绍神经网络的优化与正则化方法.第8章介绍神经网络中的注意力个神经网格中包括多机制和外部记忆种网路结构概率图模型概率图模型为机器学习提供了一个更加便捷的描述框架。第11章介绍了概率图模型的基本概念，包括模型表示、学习和推断。目前深度学习和概率图模型的融合已经十分流行.第12章介绍了两种概率图模型：玻尔兹曼机和深度信念网络.第13章和第15章分别介绍两种概率生成模型：深度生成模型和序列生成模型由于深度学习涉及非常多的研究领域，因此很多知识无法进行追根溯源并深入介绍.每章最后一节都提供了一些参考文献，读者可根据需要通过深入阅读来了解这些知识.此外，本书的附录中介绍了一些深度学习涉及的数学知识，包括线性代数，微积分、数学优化、概率论和信息论等」 1.7常用的深度学习框架在深度学习中，一般通过误差反向传播算法来进行参数学习.采用手工方式来计算梯度再写代码实现的方式会非常低效，并且容易出错.此外，深度学习模型需要的计算机资源比较多，一般需要在CPU和GPU之间不断进行切换，开发难度也比较大.因此，一些支持自动梯度计算、无缝CPU和GPU切换等功能的深自动梯度计算参见度学习框架就应运而生.比较有代表性的框架包括：Theano、Caffe、TensorFlow、第45节 Pytorch,飞桨(PaddlePaddle)、Chainer和MXNet等 (l)Theano2:由蒙特利尔大学的Python工具包，用来高效地定义、优Theano项目目前已停化和计算张量数据的数学表达式.Thea0可以透明地使用GPU和高效的符号止堆护微分 (2)Caffe:由加州大学伯克利分校开发的针对卷积神经网络的计算框架ㄧ更全面的深度学习框架介绍可以参考https/en.wikipedia..org/wiki/Comparison_of_deep learning_software aring.net/software/thean oioArchitecture for Fast Feature Embeding.fberkele https://nndleithub.io/

1.7 常用的深度学习框架 2021 年 5 月 18 日 17 则和优化算法，并以线性回归为例来讲述不同学习算法之间的关联．第3章主要介绍一些基本的线性模型．这两章都以监督学习为主进行介绍．第9章介绍了一些无监督学习方法，包括无监督特征学习和概率密度估计．第10章中介绍了一些和模型无关的机器学习方法．第14章介绍了深度强化学习的知识．神经网络神经网络作为一类非线性的机器学习模型，可以更好地实现输入和输出之间的映射．虽然这里将神经网络结构大体上分为三种类型，但是大多数网络都是复合型结构，即一个神经网络中包括多种网络结构．第4章到第6章分别讲述三种主要的神经网络模型：前馈神经网络、卷积神经网络和循环神经网络．第6章也简单介绍了一种更一般性的网络：图网络．第7章介绍神经网络的优化与正则化方法．第8章介绍神经网络中的注意力机制和外部记忆．概率图模型概率图模型为机器学习提供了一个更加便捷的描述框架．第11章介绍了概率图模型的基本概念，包括模型表示、学习和推断．目前深度学习和概率图模型的融合已经十分流行．第12章介绍了两种概率图模型：玻尔兹曼机和深度信念网络．第13章和第15章分别介绍两种概率生成模型：深度生成模型和序列生成模型．由于深度学习涉及非常多的研究领域，因此很多知识无法进行追根溯源并深入介绍．每章最后一节都提供了一些参考文献，读者可根据需要通过深入阅读来了解这些知识．此外，本书的附录中介绍了一些深度学习涉及的数学知识，包括线性代数、微积分、数学优化、概率论和信息论等． 1.7 常用的深度学习框架在深度学习中，一般通过误差反向传播算法来进行参数学习．采用手工方式来计算梯度再写代码实现的方式会非常低效，并且容易出错．此外，深度学习模型需要的计算机资源比较多，一般需要在 CPU 和 GPU 之间不断进行切换，开发难度也比较大．因此，一些支持自动梯度计算、无缝CPU和GPU切换等功能的深度学习框架就应运而生．自动梯度计算参见第4.5节．比较有代表性的框架包括：Theano、Caffe、TensorFlow、 Pytorch、飞桨（PaddlePaddle）、Chainer和MXNet等1．（1） Theano2：由蒙特利尔大学的 Python 工具包， Theano 项目目前已停止维护．用来高效地定义、优化和计算张量数据的数学表达式．Theano 可以透明地使用 GPU 和高效的符号微分．（2） Caffe3：由加州大学伯克利分校开发的针对卷积神经网络的计算框架， 1 更全面的深度学习框架介绍可以参考https://en.wikipedia.org/wiki/Comparison_of_deep_ learning_software． 2 http://www.deeplearning.net/software/theano 3 全称为Convolutional Architecture for Fast Feature Embedding，http://caffe.berkeleyvision.org https://nndl.github.io/

1.7常用的深度学习框架 2021年5月18日 18 主要用于计算机视觉.Cae用C++和Python实现，但可以通过配置文件来实Cae2已经被并入现所要的网络结构，不需要编码。 PyTorch中. (3)TensorFlow:由Google公司开发的深度学习框架，可以在任意具备CPU或者GPU的设备上运行.TensorFlow的计算过程使用数据流图来表示. TensorFlow的名字来源于其计算过程中的操作对象为多维数组，即张量(Ten: sor).TensorFlow 1.0版本采用静态计算图，2.0版本之后也支持动态计算图. 计算图参见第4.5.3节 (4)PyTorch:由Facebook、NVIDIA、Twitter等公司开发维护的深度学习框架，其前身为Lua语言的Torch3.PyTorch也是基于动态计算图的框架，在需要动态改变神经网络结构的任务中有着明显的优势。 (5)飞桨(PaddlePaddle)4:由百度开发的一个高效和可扩展的深度学习框架，同时支持动态图和静态图.飞桨提供强大的深度学习并行技术，可以同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练，支持千亿规模参数和数百个节点的高效并行训练 (6)MindSpore':由华为开发的一种适用于端边云场景的新型深度学习训练/推理框架.MindSpore为Ascend AI处理器提供原生支持，以及软硬件协同优化 (7)Chainer:一个最早采用动态计算图的深度学习框架，其核心开发团队为来自日本的一家机器学习创业公司Preferred Networks.和Tensorflow、 Theano、Caffe等框架使用的静态计算图相比，动态计算图可以在运行时动态地构建计算图，因此非常适合进行一些复杂的决策或推理任务。 (8)MXNet?:由亚马逊、华盛顿大学和卡内基·梅隆大学等开发维护的深度学习框架.MXNt支持混合使用符号和命令式编程来最大化效率和生产率，并可以有效地扩展到多个GPU和多台机器. 在这些基础框架之上，还有一些建立在这些框架之上的高度模块化的神经网络库，使得构建一个神经网络模型就像搭积木一样容易.其中比较有名的模块目前，Kes已经被集化神经网络框架有：l)基于TensorFlow和Theano的Keras3;2)基于Theano 成到TensorFlow2.0版的Lasagne':3)面向图结构数据的DGLo. https://www.tensorflow.org 2 http://pytorch.org 3http://torch.ch Parallel Distributed Deep Leaming.http://paddlepaddleor/ shttps://www.mindspore.cn/ 6 https://chainerorg 7 https://mxnetapache.org http://keras.io/ https://github.com/Lasagne/Lasagne 10 Deep Graph Library.PyTorch,MXNet TensorFlow.https://www.dglai/. https://nndl.github.io/

1.7 常用的深度学习框架 2021 年 5 月 18 日 18 主要用于计算机视觉．Caffe 用 C++ 和 Python 实现，但可以通过配置文件来实现所要的网络结构，不需要编码． Caffe2已经被并入 PyTorch中．（3） TensorFlow1：由 Google 公司开发的深度学习框架，可以在任意具备CPU或者GPU的设备上运行．TensorFlow的计算过程使用数据流图来表示． TensorFlow 的名字来源于其计算过程中的操作对象为多维数组，即张量（Tensor）．TensorFlow 1.0版本采用静态计算图，2.0 版本之后也支持动态计算图．计算图参见第4.5.3节．（4） PyTorch2：由 Facebook、NVIDIA、Twitter 等公司开发维护的深度学习框架，其前身为 Lua 语言的 Torch3．PyTorch 也是基于动态计算图的框架，在需要动态改变神经网络结构的任务中有着明显的优势．（5）飞桨（PaddlePaddle）4：由百度开发的一个高效和可扩展的深度学习框架，同时支持动态图和静态图．飞桨提供强大的深度学习并行技术，可以同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练，支持千亿规模参数和数百个节点的高效并行训练．（6） MindSpore5：由华为开发的一种适用于端边云场景的新型深度学习训练/推理框架．MindSpore为Ascend AI处理器提供原生支持，以及软硬件协同优化．（7） Chainer6：一个最早采用动态计算图的深度学习框架，其核心开发团队为来自日本的一家机器学习创业公司 Preferred Networks．和 Tensorflow、 Theano、Caffe 等框架使用的静态计算图相比，动态计算图可以在运行时动态地构建计算图，因此非常适合进行一些复杂的决策或推理任务．（8） MXNet7：由亚马逊、华盛顿大学和卡内基·梅隆大学等开发维护的深度学习框架．MXNet支持混合使用符号和命令式编程来最大化效率和生产率，并可以有效地扩展到多个GPU和多台机器．在这些基础框架之上，还有一些建立在这些框架之上的高度模块化的神经网络库，使得构建一个神经网络模型就像搭积木一样容易．其中比较有名的模块化神经网络框架有：1）基于 TensorFlow 和 Theano 的 Keras8；2）基于 Theano 的Lasagne9；目前，Keras 已经被集成到TensorFlow 2.0版本中． 3）面向图结构数据的DGL10 ． 1 https://www.tensorflow.org 2 http://pytorch.org 3 http://torch.ch 4 Parallel Distributed Deep Learning，http://paddlepaddle.org/ 5 https://www.mindspore.cn/ 6 https://chainer.org 7 https://mxnet.apache.org 8 http://keras.io/ 9 https://github.com/Lasagne/Lasagne 10 Deep Graph Library，支持PyTorch、MXNet和TensorFlow，https://www.dgl.ai/． https://nndl.github.io/

1.8总结和深入阅读 2021年5月18日 19 1.8总结和深入阅读要理解深度学习的意义或重要性，就得从机器学习或者是人工智能的更广的视角来分析.在传统机器学习中，除了模型和学习算法外，特征或表示也是影响最终学习效果的重要因素，甚至在很多的任务上比算法更重要.因此，要开发一个实际的机器学习系统，人们往往需要花费大量的精力去尝试设计不同的特征以及特征组合，来提高最终的系统能力，这就是所谓的特征工程问题，如何自动学习有效的数据表示成为机器学习中的关键问题.早期的表示学习方法，比如特征抽取和特征选择，都是人工引入一些主观假设来进行学习的. 这种表示学习不是端到端的学习方式，得到的表示不一定对后续的机器学习任务有效.而深度学习是将表示学习和预测模型的学习进行端到端的学习，中间不需要人工干预.深度学习所要解决的问题是贡献度分配问题，而神经网络恰好是解决这个问题的有效模型.套用马克思的一句名言，“金银天然不是货币，但货币天然是金银”，我们可以说，神经网络天然不是深度学习，但深度学习天然是神经网络目前，深度学习主要以神经网络模型为基础，研究如何设计模型结构，如何有效地学习模型的参数，如何优化模型性能以及在不同任务上的应用等.[Ben- gio et al,.2013]给出了一个很好的表示学习综述.若希望全面了解人工神经网络和深度学习的知识，可以参考《Deep Learning》[Goodfellow et al.,20l6]以及文献[Bengio,,2009.关于神经网络的历史可以参考文献[Anderson et al,200o] 斯坦福大学的CS231n1和CS224n是两门非常好的深度学习入门课程，分别从计算机视觉和自然语言处理两个角度来讲授深度学习的基础知识和最新进展. 深度学习的研究进展非常迅速.因此，最新的文献一般会发表在学术会议上.和深度学习相关的学术会议主要有： (l)国际表示学习会议3(International Conference on Learning Repre- sentations,ICLR):主要聚焦于深度学习. (2)神经信息处理系统年会(Annual Conference on Neural Informa- tion Processing Systems,.NeurIPS):交叉学科会议，但偏重于机器学习.主要包括神经信息处理，统计方法、学习理论以及应用等 (3)国际机器学习会议(International Conference on Machine Learn- ing,ICML):机器学习顶级会议，深度学习作为近年来的热点，也占据了ICML http://cs231n.stanford.edu 2http://web.stanford.edu/class/cs224n/ 3 http://www.iclr.cc 4https://nips.cc shttps://icml.cc https://nndl.github.io/

1.8 总结和深入阅读 2021 年 5 月 18 日 19 1.8 总结和深入阅读要理解深度学习的意义或重要性，就得从机器学习或者是人工智能的更广的视角来分析．在传统机器学习中，除了模型和学习算法外，特征或表示也是影响最终学习效果的重要因素，甚至在很多的任务上比算法更重要．因此，要开发一个实际的机器学习系统，人们往往需要花费大量的精力去尝试设计不同的特征以及特征组合，来提高最终的系统能力，这就是所谓的特征工程问题．如何自动学习有效的数据表示成为机器学习中的关键问题．早期的表示学习方法，比如特征抽取和特征选择，都是人工引入一些主观假设来进行学习的．这种表示学习不是端到端的学习方式，得到的表示不一定对后续的机器学习任务有效．而深度学习是将表示学习和预测模型的学习进行端到端的学习，中间不需要人工干预．深度学习所要解决的问题是贡献度分配问题，而神经网络恰好是解决这个问题的有效模型．套用马克思的一句名言，“金银天然不是货币，但货币天然是金银”，我们可以说，神经网络天然不是深度学习，但深度学习天然是神经网络．目前，深度学习主要以神经网络模型为基础，研究如何设计模型结构，如何有效地学习模型的参数，如何优化模型性能以及在不同任务上的应用等．[Bengio et al., 2013]给出了一个很好的表示学习综述．若希望全面了解人工神经网络和深度学习的知识，可以参考《Deep Learning》[Goodfellow et al., 2016]以及文献 [Bengio, 2009]．关于神经网络的历史可以参考文献 [Anderson et al., 2000]．斯坦福大学的 CS231n1 和 CS224n2是两门非常好的深度学习入门课程，分别从计算机视觉和自然语言处理两个角度来讲授深度学习的基础知识和最新进展．深度学习的研究进展非常迅速．因此，最新的文献一般会发表在学术会议上．和深度学习相关的学术会议主要有：（1）国际表示学习会议3（International Conference on Learning Representations，ICLR）：主要聚焦于深度学习．（2）神经信息处理系统年会4（Annual Conference on Neural Information Processing Systems，NeurIPS）：交叉学科会议，但偏重于机器学习．主要包括神经信息处理、统计方法、学习理论以及应用等．（3）国际机器学习会议5（International Conference on Machine Learning，ICML）：机器学习顶级会议，深度学习作为近年来的热点，也占据了 ICML 1 http://cs231n.stanford.edu 2 http://web.stanford.edu/class/cs224n/ 3 http://www.iclr.cc 4 https://nips.cc 5 https://icml.cc https://nndl.github.io/

参考文献 2021年5月18日 20 的很大比例 (4)国际人工智能联合会议！(International Joint Conference on Artifi- cial Intelligence,ICAI):人工智能领域最顶尖的综合性会议.历史悠久，从 1969年开始举办 (5)美国人工智能协会年会2(AAAI Conferenceon Artificial Intelligence, AAAI):人工智能领域的顶级会议，每年二月份左右召开，地点一般在北美，另外，人工智能的很多子领域也都有非常好的专业学术会议.在计算机视觉领域，有计算机视觉与模式识别大会(IEEE Conference on Computer Vision and Pattern Recognition,CVPR)和国际计算机视觉会议(International Com- ference on Computer Vision,ICCV).在自然语言处理领域，有计算语言学年 Annual Meeting of the Association for Computational Linguistics.ACL) 和自然语言处理实证方法大会(Conference on Empirical Methods in Natural Language Processing.EMNLP). 参考文献周志华，2016.机器学习[M.北京：清华大学出版社. Anderson JA.Rosenfeld E.2000.Talking nets:An oral history of neural networks[M).MIT Press cells make the human brain an isometrically scaled-up primate brain[J).Journal of Comparative Neurology,513(5532-541. Bengio Y.2009.Learning deeparchitectures forAI[].Foundationsand trends in Machine Learning. 211-127. BengoY.Courville A.Vincent P.2013.Representation learing:A review and new perspectives IEEE transactions on pattern analysis and machine intelligence.35(8):1798-1828. Fukushima K,1980.Neocognitron:A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J.Biological cybernetics,36(4):193-202. Goodfellow IJ,Bengio Y.Courville AC.2016.Deep learning[M/OL]MIT Press.http://www amingbook.c Hinton G.Deng L Yu D.et al,2012.Deep neural networks for acoustic modeling in speech recog- nition:The shared views of four research groups[J].IEEE Signal Processing Magazine,296): 82.97. Hinton G E,Salakhutdinov RR.2006.Reducing the dimensionality of data with neural networks 0.Science,313(5786)504507 KrizhevskyA.Sutskever1,Hinton ImageNet classification with deep ral networks[C]//Advances in Neural Information Processing Systems 25.1106-1114. LeCun Y,Boser B.Denker J,etal,199.Backpropagation applied to handwritten zip code recog- nition[J].Neural computation,1(4):541-551. https://www.ijcai.org 2 http://www.aaai.org https://nndl.github.io

参考文献 2021 年 5 月 18 日 20 的很大比例．（4）国际人工智能联合会议1（International Joint Conference on Artificial Intelligence，IJCAI）：人工智能领域最顶尖的综合性会议．历史悠久，从 1969年开始举办．（5）美国人工智能协会年会2（AAAI Conference on Artificial Intelligence， AAAI）：人工智能领域的顶级会议，每年二月份左右召开,地点一般在北美．另外，人工智能的很多子领域也都有非常好的专业学术会议．在计算机视觉领域，有计算机视觉与模式识别大会（IEEE Conference on Computer Vision and Pattern Recognition，CVPR）和国际计算机视觉会议（International Comference on Computer Vision，ICCV）．在自然语言处理领域，有计算语言学年会（Annual Meeting of the Association for Computational Linguistics，ACL）和自然语言处理实证方法大会（Conference on Empirical Methods in Natural Language Processing，EMNLP）等．参考文献周志华, 2016. 机器学习[M]. 北京: 清华大学出版社. Anderson J A, Rosenfeld E, 2000. Talking nets: An oral history of neural networks[M]. MIT Press. Azevedo F A, Carvalho L R, Grinberg L T, et al., 2009. Equal numbers of neuronal and nonneuronal cells make the human brain an isometrically scaled-up primate brain[J]. Journal of Comparative Neurology, 513(5):532-541. Bengio Y, 2009. Learning deep architectures for AI[J]. Foundations and trends in Machine Learning, 2(1):1-127. Bengio Y, Courville A, Vincent P, 2013. Representation learning: A review and new perspectives[J]. IEEE transactions on pattern analysis and machine intelligence, 35(8):1798-1828. Fukushima K, 1980. Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]. Biological cybernetics, 36(4):193-202. Goodfellow I J, Bengio Y, Courville A C, 2016. Deep learning[M/OL]. MIT Press. http://www. deeplearningbook.org/. Hinton G, Deng L, Yu D, et al., 2012. Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups[J]. IEEE Signal Processing Magazine, 29(6): 82-97. Hinton G E, Salakhutdinov R R, 2006. Reducing the dimensionality of data with neural networks [J]. Science, 313(5786):504-507. Krizhevsky A, Sutskever I, Hinton G E, 2012. ImageNet classification with deep convolutional neural networks[C]//Advances in Neural Information Processing Systems 25. 1106-1114. LeCun Y, Boser B, Denker J S, et al., 1989. Backpropagation applied to handwritten zip code recognition[J]. Neural computation, 1(4):541-551. 1 https://www.ijcai.org 2 http://www.aaai.org https://nndl.github.io/

点击进入文档下载页（PDF格式）

共444页，可试读40页，点击继续阅读 ↓↓

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录