当前位置：和泉文库 > 计算机 > 浏览文档

《自然语言处理》课程教学资源（PPT课件讲稿）语言模型

• 概述 • 参数估计 • 基本平滑算法 • 其它平滑算法

文件格式：PPT，文件大小：182KB，售价：11.9元

共50页，可试读17页，点击往前阅读 ↑↑

文档详细内容（约50页）

参数估计

完美的语言模型对于词序列W=w1,w2,Wn 如何计算p(W)? 根据链式规则: p(W=p(wp(w2lW1.p(wlwi,,wn-d 即使对于很小的n,上面的理想公式也很难计算,因为参数太多

完美的语言模型 • 对于词序列W=w1 ,w2 ,…,wn • 如何计算p(W)？ • 根据链式规则： p(W)=p(w1 )p(w2 |w1 )…p(wn |w1 ,…,wn-1 ) • 即使对于很小的n，上面的理想公式也很难计算，因为参数太多

马尔科夫链有限的记忆能力不考虑太“老”的历史只记住前k个词W…,Wk 称为k阶马尔科夫近似 p(W)=∏1=1.(ww:k,W1),d=W

马尔科夫链 • 有限的记忆能力 – 不考虑太“老”的历史 – 只记住前k个词w1 ,…,wk – 称为k阶马尔科夫近似 • p(W)=∏i=1…dp(wi |wi-k ,…,wi-1 ), d=|W|

N元语言模型 n-1阶马尔科夫近似称为n元语言模型(LM, Language Model) p(Wl dp(wilwin+l.,Wid), d=W n越大,需要估计的参数越多,假设词汇量为20,000 模型需要的参数数量 0阶(一元 Unigram) 20,000 1阶(二元 bigram) 20.000*19999=400 million 2阶(三元 trigram) 20.0002*19999=8 trillion 3阶(四元 four-gram) 20.0003*19999=1.6*1017

N元语言模型 • n-1阶马尔科夫近似称为n元语言模型(LM, Language Model) – p(W)=∏i=1…dp(wi |wi-n+1,…,wi-1 ), d=|W| • n越大，需要估计的参数越多，假设词汇量为20,000 模型需要的参数数量 0阶(一元Unigram) 20,000 1阶(二元bigram) 20,000*19,999 = 400 million 2阶(三元trigram) 20,0002*19,999 = 8 trillion 3阶(四元four-gram) 20,0003*19,999 = 1.6*1017

语言模型的讨论 n多大? 理论上讲,越大越好经验值:3, trigram用的最多 four-gram需要太多的参数,很难估计了目前一般直接计算词形,不进行语言学处理, 如形态还原等可靠性( Reliability)和可区别性( Discrimination 成反比,需要折中 n越大,区别力越大;n越小,可靠性越高

语言模型的讨论 • n多大？ – 理论上讲，越大越好 – 经验值：3，trigram用的最多 • four-gram需要太多的参数，很难估计了 • 目前一般直接计算词形，不进行语言学处理，如形态还原等 • 可靠性(Reliability)和可区别性(Discrimination) 成反比，需要折中 – n越大，区别力越大；n越小，可靠性越高

点击进入文档下载页（PPT格式）

共50页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

中国科学技术大学：《计算机文化基础》课程教学资源（PPT课件讲稿，共四章，李金龙）
清华大学：《计算机导论》课程电子教案（PPT教学课件）第5章程序设计知识
北京建筑大学：《计算机图形学》课程教学资源（PPT课件讲稿）第一章绪论（吕书强）
理论计算机科学（PPT专题讲稿）Topics in Theoretical Computer Science（Linear Programming）
《C语言程序设计》课程电子教案（PPT课件讲稿）第9章文件操作
香港科技大学：Recent Development of Heterogeneous Information Networks - From Meta-paths to Meta-graphs
西安培华学院：《计算机应用基础》课程教学资源（PPT课件讲稿）第1章信息技术与计算机基础知识
同济大学：FWA for Noisy Optimization Problems（张军旗）
南京大学：《编译原理》课程教学资源（PPT课件讲稿）第三章词法分析
电子科技大学：《计算机操作系统》课程教学资源（PPT课件）第一章操作系统引论
电子工业出版社：《计算机网络》课程教学资源（第五版，PPT课件讲稿）第五章运输层
四川大学：《操作系统 Operating System》课程教学资源（PPT课件讲稿）Chapter 5 互斥与同步（Mutual Exclusion and Synchronization）5.1 Principles of Concurrency 5.2 Mutual Exclusion
《计算机网络》课程教学资源（PPT课件讲稿）第7章运输层
河南中医药大学（河南中医学院）：《计算机文化》课程教学资源（PPT课件讲稿）第八章数字多媒体
丽水职业技术学院：《电子商务实训》课程教学资源（PPT课件讲稿）电子商务交易模式之“B2C”
中国科学技术大学：《数据结构》课程教学资源（PPT课件）第八章查找表
《数据结构》课程教学资源（PPT课件讲稿）第九章排序 Sort
《微机原理》课程教学资源（PPT课件讲稿）第三章寻址方式与指令系统
《数据结构和编程设计》课程教学资源（PPT课件讲稿）Chapter 1 Programming Principles
西安电子科技大学：人工神经网络（PPT讲稿）Artificial Neural Networks（Introduction）
A New Approach for Accurate Modelling of Medium Access Control（MAC）Protocols
贵州师范学院：《高级语言程序设计 Advanced Programming》课程教学资源（PPT课件讲稿）第9章结构体
《大型机高级系统管理技术》课程教学资源（PPT课件讲稿）第3章作业控制语言
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿）第九章图计算

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录