也就是,“对于查询Q相关还是不相关,然 后相对Q来估计数据库中对象的类标签 检索分类的特点 1.分类变量的定义是由用户掌握的(用户定义查 询Q),因此每次运行系统时都可能变伟 2主要目标不是分类出数据库的所有对象,而 是返回与用户查询最相关的对象
◼ 也就是,“对于查询Q相关还是不相关”,然 后相对Q来估计数据库中对象的类标签。 ◼ 检索分类的特点: 1.分类变量的定义是由用户掌握的(用户定义查 询Q),因此每次运行系统时都可能变化。 2.主要目标不是分类出数据库的所有对象,而 是返回与用户查询最相关的对象
准率对奇全 ■假定我们在一个独立的检验数据集上评价一个 指定检索系统相对特定查询的性能。检验数 据中的对象已经被预先分类为相对于查询Q是 相关还是不相关。假定这个检验数据集没有被 这个检索算法使用过,我们可以把检索算法想 象为就是要对这个数据集中的对象作出分类 (按照相对于查询Q的相关性) 如果这个算法是使用距离尺度(数据集中的每 个对象相对于Q的距离)来排列对象集合的, 那么这个算法通常具有一个,值参数T
二、查准率对查全率 ◼ 假定我们在一个独立的检验数据集上评价一个 指定检索系统相对特定查询Q的性能。检验数 据中的对象已经被预先分类为相对于查询Q是 相关还是不相关。假定这个检验数据集没有被 这个检索算法使用过,我们可以把检索算法想 象为就是要对这个数据集中的对象作出分类 (按照相对于查询Q的相关性)。 ◼ 如果这个算法是使用距离尺度(数据集中的每 个对象相对于Q的距离)来排列对象集合的, 那么这个算法通常具有一个阈值参数T