:噪声通道:黄金规则 适用于OCR,手写识别,语音识别,机 器翻译,词性标注等各个问题 贝叶斯公式:P(AB)PBA)P(AP(B) Abest argmaxA P(BAP(A) P(BA)是声学图像翻译等模型 在不同领域用不同的术语来描述 P(A)是语言模型
噪声通道:黄金规则 • 适用于OCR,手写识别,语音识别,机 器翻译,词性标注等各个问题 • 贝叶斯公式:P(A|B)=P(B|A)P(A)/P(B) • Abest=argmaxA P(B|A)P(A) • P(B|A)是声学/图像/翻译等模型 – 在不同领域用不同的术语来描述 • P(A)是语言模型
什么是语言模型( Language Model) 模 模型是用来计算一个句子的概率的概率 例如:P(w1,w2,wy ·语言模型的用途 决定哪一个词序列的可能性更大 已知若干个词,预测下一个词 应用 语音识别 机器翻译 上下文敏感的拼写检查
什么是语言模型(Language Model) • 语言模型是用来计算一个句子的概率的概率 模型 – 例如:P(w1 ,w2 ,…,wn ) • 语言模型的用途 – 决定哪一个词序列的可能性更大 – 已知若干个词,预测下一个词 • 应用 – 语音识别 – 机器翻译 – 上下文敏感的拼写检查
应用于语音识别 有的词序列听起来很像,但并不都是正 确的句子 例子1: I went to a party Eye went two a bar tea 例子2: 你现在在干什么?√ 你西安载感什么?
应用于语音识别 • 有的词序列听起来很像,但并不都是正 确的句子 – 例子1: • I went to a party. √ • Eye went two a bar tea. – 例子2: • 你现在在干什么? √ • 你西安载感什么?
应用于机器翻译 给定一个汉语句子 例如:王刚出现在电视上 英文译文: Wang Gang appeared in TV In Wang gang appeared TV. Wang Gang appeared on TV
应用于机器翻译 • 给定一个汉语句子 – 例如:王刚出现在电视上。 – 英文译文: • Wang Gang appeared in TV. • In Wang Gang appeared TV. • Wang Gang appeared on TV. √
应用于拼写检查 举例 汉语 我自己知道 我自已知道 英语 Wang Gang appeared on tv.v Wang Gang appeared of Tv
应用于拼写检查 • 举例 – 汉语 • 我自己知道 √ • 我自已知道 – 英语 • Wang Gang appeared on TV. √ • Wang Gang appeared of TV