当前位置：和泉文库 > 计算机 > 浏览文档

哈尔滨工业大学：再探深度学习词向量表示（PPT课件讲稿）Advanced word vector representations（主讲人：李泽魁）

• Lecture 1 知识点回顾 • 神经概率语言模型(Bengio 2003) • Word2vec (Mikolov 2013) • (CBOW & Skip-gram) * (HS & NEG) • 词向量的评价方法 • Softmax分类模型(原PPT乱入) • 词向量的应用场景

文件格式：PPT，文件大小：3.24MB，售价：12.54元

共53页，可试读18页，点击往前阅读 ↑↑

文档详细内容（约53页）

R 深度学习语言模型都有哪些?(粗略) 2003年, Bengio,三层的神经网络构建语言模型《 A Neural Probabilistic Language model》 P -2)C Table MatrIx lok甲p across words index for we-e+I index for ly-: index for w,I 塔款大学⌒ 社会计算与信息检索研究中心

深度学习语言模型都有哪些？(粗略) • 2003年，Bengio，三层的神经网络构建语言模型 – 《A Neural Probabilistic Language Model》

R 深度学习语言模型都有哪些?(粗略) 2008, Ronan Collobert fh Jason Weston C&w model K Natural Language Processing(almost from Scratch> 2008, Andriy Mnih FA Geoffrey Hinton Ka scalable hierarchical distributed language model> 2010. Mikoloy RNNLM <Recurrent neural network based language model> 2012, Huang KImproving Word Representations via global Context and Multiple Word prototypes> 紧需款学社会计算与信息检索研究中心

深度学习语言模型都有哪些？(粗略) • 2008，Ronan Collobert 和 Jason Weston – C&W model – 《Natural Language Processing (Almost) from Scratch》 • 2008，Andriy Mnih 和 Geoffrey Hinton – 《A scalable hierarchical distributed language model》 • 2010，Mikolov – RNNLM – 《Recurrent neural network based language model》 • 2012，Huang – 《Improving Word Representations via Global Context and Multiple Word Prototypes》

R j-th output=P(wr=/confer Bengio2003 Cw+-2 Table MatrIx k-甲 index for w-s. ndex for w)-? index for w)I Projection P Hidden L utput Layer v(Contea())□ v(Conte at(u)2) concatenate q (Conteat(w)n-1)D Sample:(Conteat(w), a) yuA

Bengio2003

R Bengio2003 Input L Output Laye v(Contert(u)u ( Coteau()2)□ neaten (Condeal(wn-1) aID GD a Sample:(Conteat(u), a) 该结构中的学习参数输入的词向量vW),W属于 Dictionary 各层的参数WUpq 各层的规模投影层:(n-1)*m,n为上下文词数,不超过5;m为词向量维度,10~10~3 隐藏层: n hidden,用户指定,一般为10~2量级输出层:N,词表大小,语料相关,10~4~10~5量级 most computation here(也是Word2veC的主要优化点) 隐藏层to输出层的tanh 输出层的 softmax 塔款大学⌒ 社会计算与信息检索研究中心

Bengio2003 • 该结构中的学习参数 – 输入的词向量v(w), w属于Dictionary – 各层的参数WUpq • 各层的规模 – 投影层：(n-1)*m，n为上下文词数，不超过5；m为词向量维度，10~10^3 – 隐藏层：n_hidden，用户指定，一般为10^2量级 – 输出层：N，词表大小，语料相关，10^4~10^5量级 • most computation here (也是 word2vec 的主要优化点) – 隐藏层to输出层的tanh – 输出层的softmax

R Bengio2003 soflenax 计算公式推导映射层首尾拼接(n-1)*m,记作隐藏层(未画出) 假设有h个节点 tanh(H*X+d) Table Matrix C 隐藏层与输出层权值矩阵为U(W) shared parameters 输出层 index for -e+l index for wr-? index for w)I 个节点, softmax为归一化概率y 公式为 y=b+Wa+Tanh(d+He) W矩阵输入层与输出层(跨了两层)的直连边矩阵,线性变换 Bengio发现直连边虽然不能提升模型效果,但是可以少一半的迭代次数同时他也猜想如果没有直连边,可能可以生成更好的词向量

Bengio2003 • 计算公式推导 – 映射层 • 首尾拼接(n-1)*m ，记作x – 隐藏层(未画出) • 假设有h个节点 • tanh(H*x + d) • 隐藏层与输出层权值矩阵为 U (|V|*h) – 输出层 • |V|个节点，softmax为归一化概率 y • 公式为 • W矩阵 – 输入层与输出层(跨了两层)的直连边矩阵，线性变换 – Bengio 发现直连边虽然不能提升模型效果，但是可以少一半的迭代次数 – 同时他也猜想如果没有直连边，可能可以生成更好的词向量

点击进入文档下载页（PPT格式）

共53页，可试读18页，点击继续阅读 ↓↓

您可能感兴趣的文档

中国科学技术大学：《Linux操作系统分析》课程教学资源（PPT课件讲稿）文件系统
华北科技学院：数字视频教学软件与制作（PPT课件讲稿）数字视频编辑软件Premiere 6.5（主讲：于文华）
Introduction to Convolution Neural Networks（CNN）and systems
《编译原理》课程教学资源（PPT课件讲稿）第八章代码生成
《数字图像处理》课程PPT教学课件（讲稿）第四章点运算
《计算机系统安全》课程教学资源（PPT课件讲稿）第七章公开密钥设施PKI Public key infrastructure
《密码学》课程教学资源（PPT课件讲稿）第10章密码学的新方向
清华大学：Local Area Network and Ethernet（PPT课件讲稿）
《计算机组成与设计》课程教学资源（PPT课件讲稿）第2章指令——计算机的语言
《数据挖掘导论 Introduction to Data Mining》课程教学资源（PPT课件讲稿）Data Mining Classification（Basic Concepts, Decision Trees, and Model Evaluation）
《微型计算机原理及接口技术》课程电子教案（PPT课件）第9章 AT89S52单片机的I/O扩展
四川大学：《计算机网络 Computer Networks》课程教学资源（PPT课件讲稿）Unit5 Introduction to Computer Networks
《Visual Basic程序设计》课程教学资源（PPT课件讲稿）第四章 VB的基本语句
《单片机原理及应用》课程PPT教学课件（C语言版）第4章 C51程序设计入门（单片机C语言及程序设计）
西安培华学院：《微机原理》课程教学资源（PPT课件讲稿）第一章绪论
《数据结构与算法》课程教学资源（PPT课件讲稿）第三章树 3.1 树的有关定义
《计算机网络》课程教学资源（考试大纲）计算机网络考试大纲
西安电子科技大学：《Mobile Programming》课程PPT教学课件（Android Programming）Lecture 2 Intro to Java Programming
西安电子科技大学：《数据库系统 DataBase System》课程教学资源（PPT课件讲稿）Unit 2 The Relational Model
《C语言程序设计》课程教学资源（PPT课件讲稿）第6章用数组处理批量数据
电子工业出版社：《计算机网络》课程教学资源（第六版，PPT课件讲稿）第六章应用层
清华大学：《计算机导论》课程电子教案（PPT教学课件）第3章计算机基础知识
中国科学技术大学：《现代密码学理论与实践》课程教学资源（PPT课件讲稿）第4章有限域（第五版）
西安电子科技大学：《数据库系统 DataBase System》课程教学资源（PPT课件讲稿）Unit 3 SQL

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录