基础术语与基本概念 模式识别系统简例:建立感性认识 以癌细胞识别为例,了解模式识别的全过程。 第3步:判别分类 (1)气管细胞97个,识别错误率为7.2%。 (2)肺细胞166个,识别错误率为18%。 判别的好坏通过错误率给出,不同错误的代价和风险不同。 Hangzhou Dianzi University杭州电子科技大学 School of Computer Science and Tecfnology计算机学院周文晖
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 基础术语与基本概念 模式识别系统简例:建立感性认识 以癌细胞识别为例,了解模式识别的全过程。 第3步:判别分类 (1)气管细胞97个,识别错误率为7.2% 。 (2)肺细胞166个,识别错误率为18% 。 判别的好坏通过错误率给出,不同错误的代价和风险不同
基础术语与基本概念 信息输入 数据获取 细胞涂片制备 显徽细胞图像 数字化细胞图像 模式识别一般步骤 图像预处理 预处理 区域划分 特征抽取 细胞图像的 计算机分类系统框图 特征选择/提取 决策分析 信息输出 Hangzhou Dian21乙)nivers1y杭州电子科技大学 School/of Computer Science and Technology计算机学院周文晖
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 基础术语与基本概念 模式识别一般步骤 信息输入 细胞涂片制备 显微细胞图像 数字化细胞图像 数据获取 图像预处理 区域划分 预处理 决策分析 信息输出 特征抽取 特征选择/提取 细胞图像的 计算机分类系统框图
基础术语与基本概念 判决过程 分类决策 模式识别系统组成 数据获取 预处理 特征选择 或提取 分类规则训练 模式识别系统框图 学习过程 模式识别的三个核心问题:特征提取与选释、分类规则学习、分类决策 注意:“处理”与“识别”两个概念的区别 图像、语音 处理 图像、语音 动物 具体的羊、猴 卫星照片 识别 亩产量1000斤、地形特点 处理:输入与输出是同样的对象,性质不变。 识别:输入的是事物,输出的是对它的分类、理解和描述。 Hangzhou Dian.2i乙Uer1y杭州电子科技大学 School of Computer Science and Tecfnology计算机学院周文晖
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 基础术语与基本概念 模式识别系统组成 学习过程 判决过程 分类规则训练 分类决策 数据获取 预处理 特征选择 或提取 注意:“处理”与“识别”两个概念的区别 具体的羊、猴 亩产量1000斤、地形特点 图像、语音 动物 卫星照片 图像、语音 处理 识别 处理:输入与输出是同样的对象,性质不变。 识别:输入的是事物,输出的是对它的分类、理解和描述。 模式识别系统框图 模式识别的三个核心问题:特征提取与选择、分类规则学习、分类决策
基础术语与基本概念 标记 个 个 数据获取与特征提取 编号 色泽 根蒂 敲声 好瓜 1 青绿 蜷缩 浊响 是 2 训练集← 乌黑 蜷缩 沉闪 是 3 青绿 硬挺 清脆 否 4 乌黑 稍蜷 沉闪 否 测试集 ←1 青绿 蜷缩 沉闷 ? 美媒:中国人工智能产业繁荣催生热门工作一数 曼孚科技:数据标注一A背后的百亿市场 据标注 提厚科技 业m100阴2跟0鲜3华《车满)瓦方中 Hangzhou Dian2i乙)niversity杭州电子科技大学 School of Computer Science and Tecfmnology计算机学院周文晖
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 基础术语与基本概念 数据获取与特征提取 训练集 测试集 特征 标记
基础术语与基本概念 数据获取问题 以生成具有随机性的样本数据为目标,本质上是随机数生成问题。 现实世界中的某些事物,如图像,声音,服从某种概率分布。算法需要生成“像”这些物体的样本: 以图像为例,将所有像素拼接起来形成向量x,服从某种概率分布(x),“像”某种物体的x具有更大的概率值 算法根据一组样本进行学习,得到概率密度函数,然后根据它进行采样。或者根据随机噪声直接输出样本。 算法生 成的人 脸图像 Hangzhou Dianzi University杭州电子科技大学 School of Computer Science and Tecfnology计算机学院周文晖
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 基础术语与基本概念 数据获取问题 以生成具有随机性的样本数据为目标,本质上是随机数生成问题。 现实世界中的某些事物,如图像,声音,服从某种概率分布。算法需要生成“像”这些物体的样本; 以图像为例,将所有像素拼接起来形成向量 x,服从某种概率分布 p(x) ,“像”某种物体的 x 具有更大的概率值; 算法根据一组样本进行学习,得到概率密度函数,然后根据它进行采样。或者根据随机噪声直接输出样本。 算法生 成的人 脸图像