当前位置：和泉文库 > 计算机 > 哈尔滨工业大学：《信息检索》课程教学资源（课件讲义）文本分类 Text Categorization（主讲：刘挺）

哈尔滨工业大学：《信息检索》课程教学资源（课件讲义）文本分类 Text Categorization（主讲：刘挺）

文本分类概述特征提取主要分类算法 Rocchio 法贝叶斯 K近邻决策树

文件格式：PDF，文件大小：716.83KB，售价：22.32元

文档详细内容（约122页）

特征提取(Feature Selection) 特征提取 ·在文本分类问题中遇到的一个主要困难就是高维的特征空间。 ·通常一份普通的文本在经过文本表示后，如果以词为特征，它的特征空间维数将达到几千，甚至几万。 ·大多数学习算法都无法处理如此大的维数。 ·为了能够在保证分类性能的前提下，自动降低特征空间的维数，在许多文本分类系统的实现中都引入了特征提取方法

特征提取(Feature Selection) 特征提取在文本分类问题中遇到的一个主要困难就是高维的特征空间。通常一份普通的文本在经过文本表示后，如果以词为特征，它的特征空间维数将达到几千，甚至几万。大多数学习算法都无法处理如此大的维数。为了能够在保证分类性能的前提下，自动降低特征空间的维数，在许多文本分类系统的实现中都引入了特征提取方法

学习训练样本实例：<XC()> ·一个文本实例X∈X ■带有正确的类别标记(x) ■学习的过程是在给定训练样本集合D的前提下，寻找一个分类函数八)，使得： V<x,c(x)>ED:h(x)=c(x)

学习训练样本实例：<x, c(x)> 一个文本实例 x∈X 带有正确的类别标记 c(x) 学习的过程是在给定训练样本集合D 的前提下，寻找一个分类函数h(x), 使得: ∀ < x,c(x) >∈ D : h(x) = c(x)

分类的评测偶然事件表(Contingency Table) 属于此类不属于此类判定属于此类 A B 判定不属于此类 C D ■对一个分类器的度量。准确率(precision)=a/(a+b) ·召▣率(recall)=a/(a+c) 。fallout=b/(b+d)

分类的评测偶然事件表（Contingency Table ）对一个分类器的度量准确率(precision) = a / (a + b) 召回率(recall) = a / (a + c) fallout = b / (b + d) 属于此类不属于此类判定属于此类 A B 判定不属于此类 C D

D B

D A B C

Precision BEP Recall

点击进入文档下载页（PDF格式）

共122页，可试读30页，点击继续阅读 ↓↓

您可能感兴趣的文档

北京大学：《信息检索》课程教学资源（PPT课件讲稿）Essential Background
北京大学：《信息检索》课程教学资源（PPT课件讲稿）Retrieval Models
北京大学：《信息检索》课程教学资源（PPT课件讲稿）Crawling the Web
北京大学：《信息检索》课程教学资源（PPT课件讲稿）Web Search
北京大学：《信息检索》课程教学资源（PPT课件讲稿）Course Overview（主讲：闫宏飞）
中国科学技术大学：《人工智能基础》课程教学资源（课件讲稿）Lecture 01 Introdution（主讲：吉建民）
中国科学技术大学：《人工智能基础》课程教学资源（课件讲稿）Lecture 15 智能机器人系统介绍
中国科学技术大学：《人工智能基础》课程教学资源（课件讲稿）Lecture 14 Reinforcement Learning
中国科学技术大学：《人工智能基础》课程教学资源（课件讲稿）Lecture 13 神经网络与深度学习
中国科学技术大学：《人工智能基础》课程教学资源（课件讲稿）Lecture 09 AI Planning
中国科学技术大学：《人工智能基础》课程教学资源（课件讲稿）Lecture 08 First-Order Logic and Inference in FOL
中国科学技术大学：《人工智能基础》课程教学资源（课件讲稿）Lecture 11 马尔可夫决策过程
哈尔滨工业大学：《信息检索》课程教学资源（课件讲义）信息过滤（主讲：刘挺）
哈尔滨工业大学：《信息检索》课程教学资源（课件讲义）信息检索模型 IRModel
哈尔滨工业大学：《信息检索》课程教学资源（课件讲义）信息检索概述
哈尔滨工业大学：《信息检索》课程教学资源（课件讲义）搜索引擎技术 SearchEngine
《统计自然语言处理》课程教学资源（PPT课件讲稿）第7章汉语自动分词与词性标注
北京大学：《信息检索》课程PPT课件讲稿（自然语言处理）01 Introduction（主讲：彭波）The CCF Advanced Disciplines Lectures
北京大学：《信息检索》课程PPT课件讲稿（自然语言处理）02 Link Analysis
北京大学：《信息检索》课程PPT课件讲稿（自然语言处理）03 Web Spam
北京大学：《信息检索》课程PPT课件讲稿（自然语言处理）04 Recommendation System
北京大学：《信息检索》课程PPT课件讲稿（自然语言处理）05 Infrastructure and Cloud
河南科技学院：信息工程学院本科课程教学大纲汇编（计算机科学与技术专业）
广东茂名农林科技职业学院：计算机网络技术人才培养方案（2020级）

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录