清华大学出版社 TSINGHUA UNIVERSITY PRESS 当机械学习系统的执行元件解决完问题之后 系统就记住该问题及其解。可以把系统的执行元 件抽象成某个函数F,该函数在得到自变量输入值 (X,,,X)之后,计算并输出函数值(, ,Y)。若经过评价得知该计算是正确的, 则把联想对: [(X,%,,n),(,3,.Yo)] 存入知识库中。 以后再次需要F(X,X2,,X》 时,系统的执行机构就直接从知识库中把(Y, Y ,)检索出来而不是重新计算它,这种简 单的学习模式如下: ,乐,2务刀 [(X
当机械学习系统的执行元件解决完问题之后, 系统就记住该问题及其解。可以把系统的执行元 件抽象成某个函数F,该函数在得到自变量输入值 (X1,X2,…,Xn)之后,计算并输出函数值(Y1, Y2,…,Yp)。若经过评价得知该计算是正确的, 则把联想对: [(X 1,X2,…,Xn),(Y1,Y2,…Yp)] 存入知识库中。以后再次需要F(X1,X2,…,Xn ) 时,系统的执行机构就直接从知识库中把(Y1, Y 2,…,Yp )检索出来而不是重新计算它,这种简 单的学习模式如下: (X1,X2,…,Xn ) (Y1,Y2,…,Yn ) [(X1, X 2,…,Xn ),(Y1,Y2,…,Yp )] F → 存储 ⇒
清华大学出版社 TSINGHUA UNIVERSITY PRESS 假设要设计一个汽车修理成本估算保险程序,它的 输入信息是有关待修理汽车的描述,包括制造厂家、出厂 日期、车型、汽车损坏的部位以及它的损坏程度,输出则 是该汽车的修理成本。为了进行估算,系统必须在其知识 库中查找同一厂家、同一出厂日期、同一车型、同样损坏 情况的汽车,然后把知识库中对应的数据作为修理成本的 估算数据输出给用户。若在系统的知识库中没有找到这样 的汽车,则系统使用保险公司公布的赔偿规则估算出一个 修理费用,并得到确认,然后把该车的描述与估算出的费 用存储到知识库中,以便将来查找使用。 机械式学习实质上是用存储空间来换取处理时间, 所以在机械学习中要全面权衡时间与空间的关系,这样才 能取得较好的效果
假设要设计一个汽车修理成本估算保险程序,它的 输入信息是有关待修理汽车的描述,包括制造厂家、出厂 日期、车型、汽车损坏的部位以及它的损坏程度,输出则 是该汽车的修理成本。为了进行估算,系统必须在其知识 库中查找同一厂家、同一出厂日期、同一车型、同样损坏 情况的汽车,然后把知识库中对应的数据作为修理成本的 估算数据输出给用户。若在系统的知识库中没有找到这样 的汽车,则系统使用保险公司公布的赔偿规则估算出一个 修理费用,并得到确认,然后把该车的描述与估算出的费 用存储到知识库中,以便将来查找使用。 机械式学习实质上是用存储空间来换取处理时间, 所以在机械学习中要全面权衡时间与空间的关系,这样才 能取得较好的效果
清华大学出版社 TSINGHUA UNIVERSITY PRESS 8.2.2机械学习的主要问题 (1)存储结构 只有检索一个项目的时间比重新计算一个项 目的时间短时,机械学习才有意义,检索得越快, 其意义也就越大,因此,采用适当的存储结构, 使检索速度尽可能快,是机械学习中的重要问题。 在数据结构与数据库领域,为提高检索速度,人 们研究了许多卓有成效的数据存储方式,如索引 排序,杂凑等,在机械学习中可充分利用这些成 果
8.2.2 机械学习的主要问题 ⑴ 存储结构 只有检索一个项目的时间比重新计算一个项 目的时间短时,机械学习才有意义,检索得越快, 其意义也就越大,因此,采用适当的存储结构, 使检索速度尽可能快,是机械学习中的重要问题。 在数据结构与数据库领域,为提高检索速度,人 们研究了许多卓有成效的数据存储方式,如索引, 排序,杂凑等,在机械学习中可充分利用这些成 果
清华大学出版社 TSINGHUA UNIVERSITY PRESS (2)环境的稳定性和存储信息的适用性 使用机械学习时,总是认为保存的知识或信 息以后仍然有效,若环境急剧变化,保存的知识 和信息就会失效而不能再使用。例如,知识库存 储的是二十世纪九十年代计算机的配置及价格, 就不能用它来估计二十一世纪当前的计算机的配 置及价格,因为计算机发展得太快了,它的配置 和价格目前都已发生了很大的变化。解决这一问 题的办法就是随时监视环境的变化,不断更新知 识库中保存的信息或知识
⑵ 环境的稳定性和存储信息的适用性 使用机械学习时,总是认为保存的知识或信 息以后仍然有效,若环境急剧变化,保存的知识 和信息就会失效而不能再使用。例如,知识库存 储的是二十世纪九十年代计算机的配置及价格, 就不能用它来估计二十一世纪当前的计算机的配 置及价格,因为计算机发展得太快了,它的配置 和价格目前都已发生了很大的变化。解决这一问 题的办法就是随时监视环境的变化,不断更新知 识库中保存的信息或知识
清华大学出版社 TSINGHUA UNIVERSITY PRESS (3)存储与计算间的权衡 因为机械学习的根本目的是改进系统的执行能 力,因此对机械学习来说很重要的一点是它不能 降低系统的效率。这种存储与计算之间的权衡问 题有两种解决方法:一种方法是估算一下存储信 息所要花费的存储空间以及检索信息时所花费的 时间,然后将其代价与重新计算所花的代价进行 比较,再决定是否存储信息;另一种方法是把信 息先存储起来,但为了保证有足够的检索速度, 限制了存储信息的量,系统只保留那些最常使用 的信息,“忘记”那些不常使用的信息,这种方 法也叫“选择忘却”技术
⑶ 存储与计算间的权衡 因为机械学习的根本目的是改进系统的执行能 力,因此对机械学习来说很重要的一点是它不能 降低系统的效率。这种存储与计算之间的权衡问 题有两种解决方法:一种方法是估算一下存储信 息所要花费的存储空间以及检索信息时所花费的 时间,然后将其代价与重新计算所花的代价进行 比较,再决定是否存储信息;另一种方法是把信 息先存储起来,但为了保证有足够的检索速度, 限制了存储信息的量,系统只保留那些最常使用 的信息,“忘记”那些不常使用的信息,这种方 法也叫“选择忘却”技术