第17卷第3期 智能系统学报 Vol.17 No.3 2022年5月 CAAI Transactions on Intelligent Systems May 2022 浅评《新一代人工智能十问十答》 Brief review on ten questions and answers for the new generation of artificial intelligences 李向阳,吴锋 (中国科学技术大学计算机科学与技术学院,安徽合肥230026) 新一代人工智能是我国近期的一项重大发展 的时代,人们就认为意识是感官在大脑中的投 战略,影响深远。2021年李德毅院士山,围绕新一 射,是思维的一个重要组成部分(如图1所示)。 代人工智能的技术内核,做出了富有理论深度和 时至今日,虽然我们可以用精密仪器监测大脑的 实践指导意义的论断。本着“真理越辩越明”的原 活动,但依然没有弄清楚大脑是如何综合各种感 则,笔者根据个人对这一问题的理解和思考,围 官信息形成完整的意识。 绕李院士的“十问十答”的某些论点做一个简单的 评述。 一问:意识、智慧和智能是什么关系?新一 代人工智能触不触及意识? 李院士认为:意识是一种感觉,是对自身存在 的感知。而要想感知到“我”这个本体的存在,首 先需要具备知觉意识,要能够从边界上区分出“我” 和“非我”。对于生物来说,这一边界就是皮肤,制 造真正意义的皮肤还有很长的路要走。 意识确实需要一个边界,而作为这个边界的 “皮肤”则可以是一种抽象的存在。例如,一个房 间内装备了能感知温度、湿度、含氧量、粉尘密度 等信息的传感器。如果只能单纯地获取这些信 息,那当然谈不上有意识。但如果能够综合这些 信息,获得对生活在房间内人的舒适度的评估, 那这是不是在某种意义上可以称为一种意识呢? 图1笛卡尔的思维二元论 Fig.1 Descartes'dualism of thought 如果这个房间还能够根据这个信息,自动开启空 调、加湿器、制氧机、空气净化器等,让房间一直 因此,虽然如李院士所说意识和智能是可以 保持对人的最佳舒适度,这可不可以称为有智能 分离的,但意识是思维的一个重要过程,是智能 呢?在这里,这些传感器能感知的范围就是它的 的一项前提。计算机虽然有计算智能但没有意 边界。 识,是因为使用计算机的人补上了意识的空缺, 意识(consciousness)不仅要有“感”,更重要的 二者构成了一个智慧的整体。新一代人工智能如 是能“觉”,也就是要能根据感知到的信息,提取 果需要更多的自动化,就必然会触及意识,至少 出与自身相关的隐含信息。意识通常包括环境意 是狭义的意识。 识,例如安全意识、危机意识,可以看作是对个体 高等生物的生理本能是自然选择的结果,确 生存环境的评估;如果个体是群体的一部分,那 实不在当前人工智能的研究范畴。因为人工智能 还包括群体意识,例如团队意识,可以看作是个 的对象面临的是人类的选择,而不是自然的选 体对其他个体影响的评估。事实上,早在笛卡尔 择。例如,金鱼的体态对游泳、觅食不利,但得到 收稿日期:2022-05-16. 了人们的喜爱,一样能够生存和繁衍。 通信作者:李向阳.E-mail:xiangyangli@ustc.edu.cn 生物的情感基础是体内激素大幅度波动的结
浅评《新一代人工智能十问十答》 Brief review on ten questions and answers for the new generation of artificial intelligences 李向阳,吴锋 (中国科学技术大学 计算机科学与技术学院, 安徽 合肥 230026) 新一代人工智能是我国近期的一项重大发展 战略,影响深远。2021 年李德毅院士[1] ,围绕新一 代人工智能的技术内核,做出了富有理论深度和 实践指导意义的论断。本着“真理越辩越明”的原 则,笔者根据个人对这一问题的理解和思考,围 绕李院士的“十问十答”的某些论点做一个简单的 评述。 一问:意识、智慧和智能是什么关系?新一 代人工智能触不触及意识? 李院士认为:意识是一种感觉,是对自身存在 的感知。而要想感知到“我”这个本体的存在,首 先需要具备知觉意识,要能够从边界上区分出“我” 和“非我”。对于生物来说,这一边界就是皮肤,制 造真正意义的皮肤还有很长的路要走。 意识确实需要一个边界,而作为这个边界的 “皮肤”则可以是一种抽象的存在。例如,一个房 间内装备了能感知温度、湿度、含氧量、粉尘密度 等信息的传感器。如果只能单纯地获取这些信 息,那当然谈不上有意识。但如果能够综合这些 信息,获得对生活在房间内人的舒适度的评估, 那这是不是在某种意义上可以称为一种意识呢? 如果这个房间还能够根据这个信息,自动开启空 调、加湿器、制氧机、空气净化器等,让房间一直 保持对人的最佳舒适度,这可不可以称为有智能 呢?在这里,这些传感器能感知的范围就是它的 边界。 意识(consciousness)不仅要有“感”,更重要的 是能“觉”,也就是要能根据感知到的信息,提取 出与自身相关的隐含信息。意识通常包括环境意 识,例如安全意识、危机意识,可以看作是对个体 生存环境的评估;如果个体是群体的一部分,那 还包括群体意识,例如团队意识,可以看作是个 体对其他个体影响的评估。事实上,早在笛卡尔 的时代,人们就认为意识是感官在大脑中的投 射,是思维的一个重要组成部分(如图 1 所示)。 时至今日,虽然我们可以用精密仪器监测大脑的 活动,但依然没有弄清楚大脑是如何综合各种感 官信息形成完整的意识。 A B C 图 1 笛卡尔的思维二元论 Fig. 1 Descartes’ dualism of thought 因此,虽然如李院士所说意识和智能是可以 分离的,但意识是思维的一个重要过程,是智能 的一项前提。计算机虽然有计算智能但没有意 识,是因为使用计算机的人补上了意识的空缺, 二者构成了一个智慧的整体。新一代人工智能如 果需要更多的自动化,就必然会触及意识,至少 是狭义的意识。 高等生物的生理本能是自然选择的结果,确 实不在当前人工智能的研究范畴。因为人工智能 的对象面临的是人类的选择,而不是自然的选 择。例如,金鱼的体态对游泳、觅食不利,但得到 了人们的喜爱,一样能够生存和繁衍。 生物的情感基础是体内激素大幅度波动的结 收稿日期:2022−05−16. 通信作者:李向阳. E-mail:xiangyangli@ustc.edu.cn. 第 17 卷第 3 期 智 能 系 统 学 报 Vol.17 No.3 2022 年 5 月 CAAI Transactions on Intelligent Systems May 2022
第17卷 智能系统学报 ·654· 果,例如:多巴胺的大量分泌会让人产生愉悦,肾 备的。“人无爪牙之利、筋骨之强”,却能站在生 上腺激素的飙升会让人情绪激动。现代医学通过 物链的最顶端,凭借的是人类的智能。人类智能 药物或对大脑相对部位的刺激同样能产生相应的 和动物智能最大的区别在于人类的智能更加的 情感。激烈的情感能让人体的各项性能短时间内 “通用”。这背后的原理是什么,着实让人着迷。 飙升,对于应对紧急情况有利。但它同时也是一 因此,通用智能不一定是强智能,反之亦然。 柄双刃剑,可能造成过度消耗(类似CPU的超频) 我们真正需要的其实是强智能,但通过研究通用 或者歇斯底里的应激反应。对于智能体是否真的 智能可能有机会一窥智能的本质,从而创造出现 需要这种大幅度的波动还存在争议。 在没有的、新的强智能工具。这好比能够有能在 情感机器人的外显情感,更多是一种与外界 天上飞、地上跑、水面游的通用交通工具固然好, 交流的方式,不涉及内在的情感波动。 但是我们需要的或许是飞的最快的飞机、跑的最 二问:如何理解通用智能?通用智能一定是 快的汽车和游的最快的船。 强智能吗?新一代人工智能既要通用又要强智 强智能或许与人类智能相去甚远,不足以提 能,通用和强是什么关系? 供对智能的深度理解,但它却能更好地解决问 李院士认为:通用智能是跨领域的一般性智 题。通用智能或许没有想象中那么来的有“用” 能。如果说强人工智能追求的是智能纵向的深 事实上如果需要更多拥有人类智能的个体,提高 度,新一代人工智能追求的恰恰是智能横向的宽 社会生育率或许更为现实。但对它的研究却能够 度。纵向智能、横向智能都没有尽头。 让我们深入地了解智能的本质,拓展我们创造更 在这里,是不是可以理解为强智能就是要比 强智能的可能。对于新一代人工智能研究来说二 人做得更好,通用智能就是要和人一样能够完成 者同样意义重大。 多种任务?AlphaGo能够战胜人类围棋世界冠军四 三问:目前几乎所有人工智能都是在计算机 在围棋上比人做得更好,是不是就可以认为是围 上表现出来的计算机应用,即“计算机智能”。如 棋任务上的强智能了?或许还有很多人不这么认 何在物理装置上实现超出计算机智能的、受脑科 为,因为AlphaGo需要百万棋局的训练,而人只 学和认知科学启发的新一代人工智能? 需要很少的棋局。但是AlphaGo可以利用专门的 李院士认为:需要强调“介观类脑”,即在大规 硬件将百万棋局的训练压缩在很短的时间内完 模神经元群组和网络水平上模拟脑认知网络:同 成,这是人做不到的。如果不以结果作为智能强 时没有感知不会有认知,脑和外界环境不停地交 弱的评判,而要将智能的实现途径拉到和人类 互,和外部客体之间一直存在着认知对应关系。 似,做到“类人”,这可能没有太大的意义。我们 无需从分子水平讨论“类脑”智能,这应该是 不能说飞机的飞就不是飞,而鸟类的飞才是飞;飞 大多数人的共识。但如何从神经元水平模拟脑认 机的飞行能力就不能叫强,一定要“类鸟”的飞行 知网络,目前虽然取得了一些进展,但总体还没 能力才可以。所有能够超越人类的智能都值得研 有太好的途径。通过电子电路等物理装置实现脑 究,都可能造福人类。 神经网络,最大的问题可能还在于它不像神经网 诚如李院士所言,通用智能的“通用”其实也 络一样具有高度的可塑性。刚出生婴儿的大脑和 是相对而言的,有一定范围的。人也不是什么都 受过高等教育的成年人的大脑,在脑神经的连接 能做,随着社会分工的进一步精细化,人也朝着 结构上应有较大的差别。人不断学习的过程同时 特化、专才的方向发展。从生产效率的角度,通 也是不断重塑“脑回路”的过程。物理装置虽然也 用的机器永远比不上特化的专用机器。研究通用 能模拟脑神经网络,但还不能真正像脑神经一样 智能的价值可能还不仅仅局限于希望一台机器能 根据外界的反馈,自动地调整和重塑神经的连 够完成多项任务,更大的价值可能还在于希望了 接。归根结底,目前对脑神经网络的调整机制还 解智能的本质,就像古生物学家希望了解生命的 缺乏充分的认知,同时也缺乏合适的物理装置 起源一样。通过对智能本质的探究,解决目前无 能够模拟这一过程。这需要多学科交叉的共同 法解决的问题。 努力。 计算机是人类有史以来创造的最通用的工 一些古人类学的研究表明,由于环境的巨变, 具。它的通用性本质上来源于图灵机,一种“万 早期的类人猿被迫从树上来到平坦的草原上生 能”(universal)的计算机器。它可以同时用来计 活。适应了树栖生活的类人猿,很难在相对较短 算、编辑和通信,这是算盘、打字机和电话所不具 的时间内进化出适应地面上生活的身体结构(如
果,例如:多巴胺的大量分泌会让人产生愉悦,肾 上腺激素的飙升会让人情绪激动。现代医学通过 药物或对大脑相对部位的刺激同样能产生相应的 情感。激烈的情感能让人体的各项性能短时间内 飙升,对于应对紧急情况有利。但它同时也是一 柄双刃剑,可能造成过度消耗(类似 CPU 的超频) 或者歇斯底里的应激反应。对于智能体是否真的 需要这种大幅度的波动还存在争议。 情感机器人的外显情感,更多是一种与外界 交流的方式,不涉及内在的情感波动。 二问:如何理解通用智能?通用智能一定是 强智能吗?新一代人工智能既要通用又要强智 能,通用和强是什么关系? 李院士认为:通用智能是跨领域的一般性智 能。如果说强人工智能追求的是智能纵向的深 度,新一代人工智能追求的恰恰是智能横向的宽 度。纵向智能、横向智能都没有尽头。 在这里,是不是可以理解为强智能就是要比 人做得更好,通用智能就是要和人一样能够完成 多种任务?AlphaGo 能够战胜人类围棋世界冠军[2] , 在围棋上比人做得更好,是不是就可以认为是围 棋任务上的强智能了?或许还有很多人不这么认 为,因为 AlphaGo 需要百万棋局的训练,而人只 需要很少的棋局。但是 AlphaGo 可以利用专门的 硬件将百万棋局的训练压缩在很短的时间内完 成,这是人做不到的。如果不以结果作为智能强 弱的评判,而要将智能的实现途径拉到和人类 似,做到“类人”,这可能没有太大的意义。我们 不能说飞机的飞就不是飞,而鸟类的飞才是飞;飞 机的飞行能力就不能叫强,一定要“类鸟”的飞行 能力才可以。所有能够超越人类的智能都值得研 究,都可能造福人类。 诚如李院士所言,通用智能的“通用”其实也 是相对而言的,有一定范围的。人也不是什么都 能做,随着社会分工的进一步精细化,人也朝着 特化、专才的方向发展。从生产效率的角度,通 用的机器永远比不上特化的专用机器。研究通用 智能的价值可能还不仅仅局限于希望一台机器能 够完成多项任务,更大的价值可能还在于希望了 解智能的本质,就像古生物学家希望了解生命的 起源一样。通过对智能本质的探究,解决目前无 法解决的问题。 计算机是人类有史以来创造的最通用的工 具。它的通用性本质上来源于图灵机[3] ,一种“万 能”(universal)的计算机器。它可以同时用来计 算、编辑和通信,这是算盘、打字机和电话所不具 备的。“人无爪牙之利、筋骨之强”,却能站在生 物链的最顶端,凭借的是人类的智能。人类智能 和动物智能最大的区别在于人类的智能更加的 “通用”。这背后的原理是什么,着实让人着迷。 因此,通用智能不一定是强智能,反之亦然。 我们真正需要的其实是强智能,但通过研究通用 智能可能有机会一窥智能的本质,从而创造出现 在没有的、新的强智能工具。这好比能够有能在 天上飞、地上跑、水面游的通用交通工具固然好, 但是我们需要的或许是飞的最快的飞机、跑的最 快的汽车和游的最快的船。 强智能或许与人类智能相去甚远,不足以提 供对智能的深度理解,但它却能更好地解决问 题。通用智能或许没有想象中那么来的有“用”, 事实上如果需要更多拥有人类智能的个体,提高 社会生育率或许更为现实。但对它的研究却能够 让我们深入地了解智能的本质,拓展我们创造更 强智能的可能。对于新一代人工智能研究来说二 者同样意义重大。 三问:目前几乎所有人工智能都是在计算机 上表现出来的计算机应用,即“计算机智能”。如 何在物理装置上实现超出计算机智能的、受脑科 学和认知科学启发的新一代人工智能? 李院士认为:需要强调“介观类脑”,即在大规 模神经元群组和网络水平上模拟脑认知网络;同 时没有感知不会有认知,脑和外界环境不停地交 互,和外部客体之间一直存在着认知对应关系。 无需从分子水平讨论“类脑”智能,这应该是 大多数人的共识。但如何从神经元水平模拟脑认 知网络,目前虽然取得了一些进展,但总体还没 有太好的途径。通过电子电路等物理装置实现脑 神经网络,最大的问题可能还在于它不像神经网 络一样具有高度的可塑性。刚出生婴儿的大脑和 受过高等教育的成年人的大脑,在脑神经的连接 结构上应有较大的差别。人不断学习的过程同时 也是不断重塑“脑回路”的过程。物理装置虽然也 能模拟脑神经网络,但还不能真正像脑神经一样 根据外界的反馈,自动地调整和重塑神经的连 接。归根结底,目前对脑神经网络的调整机制还 缺乏充分的认知,同时也缺乏合适的物理装置 能够模拟这一过程。这需要多学科交叉的共同 努力。 一些古人类学的研究表明,由于环境的巨变, 早期的类人猿被迫从树上来到平坦的草原上生 活。适应了树栖生活的类人猿,很难在相对较短 的时间内进化出适应地面上生活的身体结构(如 第 17 卷 智 能 系 统 学 报 ·654·
·655· 李向阳,等:浅评《新一代人工智能十问十答》 第3期 尖利的爪牙、快速的奔跑等)。相对于漫长的身 习中,如果奖惩机制合适,机器人一旦开始学习 体进化,大脑是唯一能在短时间内进行调整从而 就会持续不断直到收敛。事实上,生物也可以通 快速适应环境的身体器官。从某种意义上说,人 过类似的机制学习。例如:通过人为控制小鼠大 类智能的产生也是残酷自然选择的结果。不同于 脑的多巴胺分泌,可以让小鼠学会新的技能,如 基因层面的进化,大脑的改变是不可遗传的。因 图2所示的。目前强化学习和人类的学习还有巨 此,人类发展产生了教育-学习的传承机制,生存 大的差别,关键问题之一在于如何制定合适的奖 技能和知识得以代代相传。 惩机制,这或许还有很长的路要走。就像不同的 由此可见,环境的刺激对于人类智能的产生 教育体系培养出来的人才,在能力方面也有较大 起着非常关键的作用。或许类脑智能本身就是不 的差别,不同民族对教育的重视程度也不尽相 可存储、不可转移的,而是在特定的装置(如大脑) 同。如何为机器人制定合适的教育体系(如奖惩 上,由于环境的刺激而激发出的一种能力。因此, 机制),让机器人“自觉”地偏好学习,是新一代人 类脑智能的研究不能够仅仅局限于模拟脑的结 工智能需要认真研究的课题。 构,还需要研究对脑的刺激方式,以及接受刺激 后脑结构的调整方式。只有明白这些行为背后的 大脑新皮质中多巴胺的自发刺激 复杂机理,才有可能发展出真正的“类脑智能”。 四问:机器人不会有七情六欲,学习的原动 飞秒激光 力来自何处?如果没有接受教育的自觉性,新一 國值 代人工智能如何具有学习的动机? 多巴胺传 感器信号 李院土认为:可人工赋予机器企图和任务目 通过训练多巴胺刺激 ML- 标,让机器在交互的过程中,提出自己的问题,依 追踪不断升高的國值 据任务目标,分解并确定具体的学习目标,也就 有了学习的驱动力,学习欲望强,主动性就强 时间 人的七情六欲归根结底来源于生物生存和繁 奖励 衍的本能,这是自然选择的结果。在人类社会 中,有人过早地选择结束自己的生命,有人决定 终身不要子嗣,这些是人的大脑根据某些现实因 素做出的决策。可见生物的本能并不是由遗传物 图2人为控制小鼠大脑的奖惩机制 质“携刻”在负责理性思维的大脑中,而是由身体 Fig.2 Reward and punishment mechanisms in artificially 的其他器官影响大脑的结果。例如:对食物和异 controlled mouse brains 性的渴望,这些都不是由理性思维激发。相反, 五问:人的偏好和注意力选择是如何产生 理性思维还可以根据情境对这些本能产生抑制作 的?新一代人工智能如何体现这一点? 用,控制本能的冲动。 李院士认为:人的注意力选择源于记忆,源于 因此,对于人来说,学习的原动力(本能)可 记忆的偏好依附性。记忆网络以及记忆的多索引 能主要来源于脑外(身体)的刺激,而不一定是大 并行机制很重要,注意的选择性法则是:先检索 脑内部理性思维的结果。对于远古的人来说,多 典型情境提取记忆,后选择规则推理计算求解。 学习一份技能,就多了一些生存的概率。一些缺 人的注意力产生有可能源于资源的受限。比 乏学习动力的个体可能在残酷的自然选择中被淘 如人眼只能聚焦于前方大概巴掌大的区域,所以 汰了,而延续下来的都是能够对学习产生正反馈 眼球需要不断地调整焦点,而蜻蜓的复眼就可以 的个体。再比如单细胞生物没有神经系统,但它 同时关注大片的区域,这是感知器官的不同造成 依然能够“学会”获取食物,只不过它的学习过程 的。虽然大脑的功耗比起滚烫的CPU来说已经 依赖于基因的遗传和变异来实现。 低很多,但相较于身体的其他器官依然是绝对的 如果生物学习的原动力来自自然的选择,那 耗能大户。所以才有了注意力之说,一段时间一 么机器人学习的原动力就是来自创造者(人)的 片专门的脑区激活,专注处理一件事情。而且注 选择。 意力集中的持续时间也是有限的,一段时间后资 事实上,机器人如何更好地利用外界的反馈 源消耗过度就容易精神涣散。一些药物或者酒精 来学习一直是强化学习研究的目标。在强化学 也容易让人难以集中注意力。可见,注意力对于
尖利的爪牙、快速的奔跑等)。相对于漫长的身 体进化,大脑是唯一能在短时间内进行调整从而 快速适应环境的身体器官。从某种意义上说,人 类智能的产生也是残酷自然选择的结果。不同于 基因层面的进化,大脑的改变是不可遗传的。因 此,人类发展产生了教育−学习的传承机制,生存 技能和知识得以代代相传。 由此可见,环境的刺激对于人类智能的产生 起着非常关键的作用。或许类脑智能本身就是不 可存储、不可转移的,而是在特定的装置(如大脑) 上,由于环境的刺激而激发出的一种能力。因此, 类脑智能的研究不能够仅仅局限于模拟脑的结 构,还需要研究对脑的刺激方式,以及接受刺激 后脑结构的调整方式。只有明白这些行为背后的 复杂机理,才有可能发展出真正的“类脑智能”。 四问:机器人不会有七情六欲,学习的原动 力来自何处?如果没有接受教育的自觉性,新一 代人工智能如何具有学习的动机? 李院士认为:可人工赋予机器企图和任务目 标,让机器在交互的过程中,提出自己的问题,依 据任务目标,分解并确定具体的学习目标,也就 有了学习的驱动力,学习欲望强,主动性就强。 人的七情六欲归根结底来源于生物生存和繁 衍的本能,这是自然选择的结果。在人类社会 中,有人过早地选择结束自己的生命,有人决定 终身不要子嗣,这些是人的大脑根据某些现实因 素做出的决策。可见生物的本能并不是由遗传物 质“镌刻”在负责理性思维的大脑中,而是由身体 的其他器官影响大脑的结果。例如:对食物和异 性的渴望,这些都不是由理性思维激发。相反, 理性思维还可以根据情境对这些本能产生抑制作 用,控制本能的冲动。 因此,对于人来说,学习的原动力(本能)可 能主要来源于脑外(身体)的刺激,而不一定是大 脑内部理性思维的结果。对于远古的人来说,多 学习一份技能,就多了一些生存的概率。一些缺 乏学习动力的个体可能在残酷的自然选择中被淘 汰了,而延续下来的都是能够对学习产生正反馈 的个体。再比如单细胞生物没有神经系统,但它 依然能够“学会”获取食物,只不过它的学习过程 依赖于基因的遗传和变异来实现。 如果生物学习的原动力来自自然的选择,那 么机器人学习的原动力就是来自创造者(人)的 选择。 事实上,机器人如何更好地利用外界的反馈 来学习一直是强化学习[4] 研究的目标。在强化学 习中,如果奖惩机制合适,机器人一旦开始学习 就会持续不断直到收敛。事实上,生物也可以通 过类似的机制学习。例如:通过人为控制小鼠大 脑的多巴胺分泌,可以让小鼠学会新的技能,如 图 2 所示[5]。目前强化学习和人类的学习还有巨 大的差别,关键问题之一在于如何制定合适的奖 惩机制,这或许还有很长的路要走。就像不同的 教育体系培养出来的人才,在能力方面也有较大 的差别,不同民族对教育的重视程度也不尽相 同。如何为机器人制定合适的教育体系(如奖惩 机制),让机器人“自觉”地偏好学习,是新一代人 工智能需要认真研究的课题。 大脑新皮质中多巴胺的自发刺激 飞秒激光 多巴胺传 感器信号 奖励 时间 舔食 通过训练多巴胺刺激 追踪不断升高的阈值 皮质多巴胺 奖励 阈值 图 2 人为控制小鼠大脑的奖惩机制 Fig. 2 Reward and punishment mechanisms in artificially controlled mouse brains 五问:人的偏好和注意力选择是如何产生 的?新一代人工智能如何体现这一点? 李院士认为:人的注意力选择源于记忆,源于 记忆的偏好依附性。记忆网络以及记忆的多索引 并行机制很重要,注意的选择性法则是:先检索 典型情境提取记忆,后选择规则推理计算求解。 人的注意力产生有可能源于资源的受限。比 如人眼只能聚焦于前方大概巴掌大的区域,所以 眼球需要不断地调整焦点,而蜻蜓的复眼就可以 同时关注大片的区域,这是感知器官的不同造成 的。虽然大脑的功耗比起滚烫的 CPU 来说已经 低很多,但相较于身体的其他器官依然是绝对的 耗能大户。所以才有了注意力之说,一段时间一 片专门的脑区激活,专注处理一件事情。而且注 意力集中的持续时间也是有限的,一段时间后资 源消耗过度就容易精神涣散。一些药物或者酒精 也容易让人难以集中注意力。可见,注意力对于 ·655· 李向阳,等:浅评《新一代人工智能十问十答》 第 3 期
第17卷 智能系统学报 ·656· 大脑来说是一种资源调度的过程,集中最多的资 的,因此是开放的、不完全的,允许精确性和复杂 源解决最要紧的事情。什么才是最要紧的事情, 性相容,允许不同思想兼容并包。 这源于大脑的判断。大脑会综合当前的信息和过 人类的自然语言最基础的功能还是实现不同 往的记忆做出最佳的判断。 个体间的交流。例如:动物可以通过声音来求偶 人的偏好组成就更为复杂。部分源于身体当 或警戒,越是群居的动物交流的方式越复杂。早 下的需求,例如饥饿的时候食物会变得更美味, 期人类在面对残酷的自然选择时,依靠的是群体 缺乏部分元素是会更加偏爱富含这部分元素的食 的力量来狩猎或抵御危险。在这一过程中,自然 物。部分源于大脑中的记忆,例如动物的各种警 语言的产生具有很大的历史偶然性,是集体创作 戒色会让有相关经验的捕食者望而却步。还有一 的结果。 部分源于对新刺激的本能反应,例如对新事物的 相比较而言,数学语言和计算机语言的创造 偏好等。 过程要直接得多,因此也更加简单和自恰。例如: 新一代人工智能作为人类的工具是否需要自 编程语言,就是为了方便人和计算机之间的交互 身的偏好,这个值得商榷。例如:机器学习的一 而设计的;网络协议,就是为了方便计算机和计 个重要研究方向就是防止因为训练数据而对结 算机之间的交互。因为参与者都有计算机,因此 果产生不必要的偏好,做到公平公正。但它必须 必须是计算机能够准确无误解析和执行的,是具 能够理解人的偏好,并更好地提供服务。 有图灵完备性的精确描述语言。如果没有人参与 新一代人工智能是否需要注意力在于它并行 其中,使用自然语言可能是没有必要的。比如: 处理多项事物的能力以及分工方式,也就是说, 脱离人类社会由动物抚养长大的“狼孩”,不懂人 和我们具体实现智能的方式存在直接的关系。例 的语言,但很难说他完全就没有人类的智能。 如:神经网络遍及全身的水母,能够对周边的刺 让计算机去解析和处理人类的自然语言,更 激同步地做出反应。越高等的智能,对资源的消 多的是由人工智能的工具属性决定的。目前的人 耗就越大,各部分的分工也就越细致,需要注意 工智能都是计算机实现的,而人日常中更多的是 力机制进行调度。例如:人脑就是由不同的分区 使用自然语言。从语法层面上,二者之间自然存 组成(如图3),每个分区负责不同的功能,在进行 在巨大的差别。但这都不是最困难的,最困难的 相应活动时被激活。 是在语义方面的差别。目前,存在某些自然语言 的语义是计算机语言或者数学语言所不能表示和 人类大脑分区示意图 (个性、决策、额叶 顶叶(物体识别、空间位 处理的。对这部分语义的研究,能够加深我们对 运动等) 置理解、触觉等) 自然语言的理解。 事实上,操不同语言的人之间,也没有办法完 全无障碍地交流。我通常将这理解为文化上的差 (视觉) 异。文化的确塑造了不同的语言习惯,但语言反 枕叶 过来也会影响文化。例如:印度某地方言中缺少 小脑 题叶 关于昨天的直接表述,是不是就代表这一地方的 (短时记忆、语 言、嗅觉等) 脊髓 人更看重当下?不同文化熏陶下的人和人之间尚 且有沟通障碍,让计算机理解厚重的人类文化自 图3人类大脑的功能分区 然任重道远。 Fig.3 Functional divisions of the human brain 在人类之初,由于智力的增长,我们创造并能 六问:人类思维的载体是自然语言,自然语 使用复杂的自然语言。自然语言的使用使得知识 言开放性很强,通用计算机是基于图灵机模型, 能够方便地在个体之间、上一代和下一代之间传 属于封闭的有限状态空间,根据哥德尔不完备定 递。但这或许只是因为人类受限于先天的感官, 理,数学自身难以完全自洽。因此,人工智能怎 才使用了这种并不高效、不精确的方式。如果人 么可以反过来要用计算机语言或者数学语言去形 和人之间能够用其他方式(如脑电波)交流,结果 式化人类的自然语言呢? 是不是就会完全不一样?例如:在蚁群中,通过 李院士认为:机器是否有语言智能,还要看它 信息素的交流同样能够实现相对复杂的行为。这 有没有接受语言和文字的交互、学习和进化能 些问题背后很可能藏着智能的本质,值得我们进 力。新一代人工智能是用人类的自然语言表述 一步探究
大脑来说是一种资源调度的过程,集中最多的资 源解决最要紧的事情。什么才是最要紧的事情, 这源于大脑的判断。大脑会综合当前的信息和过 往的记忆做出最佳的判断。 人的偏好组成就更为复杂。部分源于身体当 下的需求,例如饥饿的时候食物会变得更美味, 缺乏部分元素是会更加偏爱富含这部分元素的食 物。部分源于大脑中的记忆,例如动物的各种警 戒色会让有相关经验的捕食者望而却步。还有一 部分源于对新刺激的本能反应,例如对新事物的 偏好等。 新一代人工智能作为人类的工具是否需要自 身的偏好,这个值得商榷。例如:机器学习的一 个重要研究方向[6] 就是防止因为训练数据而对结 果产生不必要的偏好,做到公平公正。但它必须 能够理解人的偏好,并更好地提供服务。 新一代人工智能是否需要注意力在于它并行 处理多项事物的能力以及分工方式,也就是说, 和我们具体实现智能的方式存在直接的关系。例 如:神经网络遍及全身的水母,能够对周边的刺 激同步地做出反应。越高等的智能,对资源的消 耗就越大,各部分的分工也就越细致,需要注意 力机制进行调度。例如:人脑就是由不同的分区 组成(如图 3),每个分区负责不同的功能,在进行 相应活动时被激活。 人类大脑分区示意图 额叶 顶叶 (物体识别、空间位 置理解、触觉等) (视觉) 枕叶 小脑 脊髓 颞叶 (短时记忆、语 言、嗅觉等) (个性、决策、 运动等) 图 3 人类大脑的功能分区 Fig. 3 Functional divisions of the human brain 六问:人类思维的载体是自然语言,自然语 言开放性很强,通用计算机是基于图灵机模型, 属于封闭的有限状态空间,根据哥德尔不完备定 理,数学自身难以完全自洽。因此,人工智能怎 么可以反过来要用计算机语言或者数学语言去形 式化人类的自然语言呢? 李院士认为:机器是否有语言智能,还要看它 有没有接受语言和文字的交互、学习和进化能 力。新一代人工智能是用人类的自然语言表述 的,因此是开放的、不完全的,允许精确性和复杂 性相容,允许不同思想兼容并包。 人类的自然语言最基础的功能还是实现不同 个体间的交流。例如:动物可以通过声音来求偶 或警戒,越是群居的动物交流的方式越复杂。早 期人类在面对残酷的自然选择时,依靠的是群体 的力量来狩猎或抵御危险。在这一过程中,自然 语言的产生具有很大的历史偶然性,是集体创作 的结果。 相比较而言,数学语言和计算机语言的创造 过程要直接得多,因此也更加简单和自恰。例如: 编程语言,就是为了方便人和计算机之间的交互 而设计的;网络协议,就是为了方便计算机和计 算机之间的交互。因为参与者都有计算机,因此 必须是计算机能够准确无误解析和执行的,是具 有图灵完备性的精确描述语言。如果没有人参与 其中,使用自然语言可能是没有必要的。比如: 脱离人类社会由动物抚养长大的“狼孩”,不懂人 的语言,但很难说他完全就没有人类的智能。 让计算机去解析和处理人类的自然语言,更 多的是由人工智能的工具属性决定的。目前的人 工智能都是计算机实现的,而人日常中更多的是 使用自然语言。从语法层面上,二者之间自然存 在巨大的差别。但这都不是最困难的,最困难的 是在语义方面的差别。目前,存在某些自然语言 的语义是计算机语言或者数学语言所不能表示和 处理的。对这部分语义的研究,能够加深我们对 自然语言的理解。 事实上,操不同语言的人之间,也没有办法完 全无障碍地交流。我通常将这理解为文化上的差 异。文化的确塑造了不同的语言习惯,但语言反 过来也会影响文化。例如:印度某地方言中缺少 关于昨天的直接表述,是不是就代表这一地方的 人更看重当下?不同文化熏陶下的人和人之间尚 且有沟通障碍,让计算机理解厚重的人类文化自 然任重道远。 在人类之初,由于智力的增长,我们创造并能 使用复杂的自然语言。自然语言的使用使得知识 能够方便地在个体之间、上一代和下一代之间传 递。但这或许只是因为人类受限于先天的感官, 才使用了这种并不高效、不精确的方式。如果人 和人之间能够用其他方式(如脑电波)交流,结果 是不是就会完全不一样?例如:在蚁群中,通过 信息素的交流同样能够实现相对复杂的行为。这 些问题背后很可能藏着智能的本质,值得我们进 一步探究。 第 17 卷 智 能 系 统 学 报 ·656·
·657· 李向阳,等:浅评《新一代人工智能十问十答》 第3期 七问:如何体现新一代人工智能与时俱进的 忆、交互和计算3部件组成,其中的感知、认知与 学习能力? 行为都是双向互动的。记忆、交互和计算3部分 李院士认为:新一代人工智能也必须具有像 之间的信息传递机制和螺旋发展比较复杂,但三 人一样的学习和交互认知的环境才能习得知识, 位一体很重要。 而不是传统人工智能那样一次性设计而成,也不 同冯诺依曼的计算机体系作类比,记忆可以 是带着特殊预设目的,向机器强制地集中性注入 看作存储,交互是键盘、鼠标、屏幕等这些输入输 一个或者多个专门领域的计算智能。 出外设,而计算则是CPU。记忆系统里有瞬时记 这其实涉及到了人工智能一个最基础的问 忆、工作记忆和长期记忆3类子部件,存储系统 题:智能是否能够被记录、存储和传递。自然界 中的寄存器、内存和硬盘分别负责瞬时、工作和 中声音可以、图像也可以,甚至生物个体通过遗 长期的存储。计算机的记忆与人的记忆最大的区 传物质DNA也可以被克隆。两个克隆人之间最 别其实在于信息的表示方式。计算机采用的是二 初拥有共同的生物基础,也会因为后天的经历不 进制进行存储和运算的,所有的信息都需要以一 同表现出不同的智能。假设给我们一个爱因斯坦 定的方式编码成二进制。而记忆在人脑中是以神 的大脑,而我们的生物技术已经发达到能够复刻 经元突触的连接形式来实现的。 一个完全一样的大脑,那么这个大脑是否和爱因 人工神经网络从某种意义上可以看作是在二 斯坦一样聪明?理论上,同一个软件在不同计算 进制的计算机系统中模拟神经元的记忆机制。从 机上的拷贝应该有完全一样的表现。但复杂如大 计算效率上看,这是低效的。所以有了关于“类 脑,这或许是一个不可能的任务,或许像很多量 脑”芯片的研究,希望能够提高模拟的效率。这些 子现象一样我们进行记录的那一刻大脑已经发生 “类脑”芯片虽然在连接上模拟神经元,但是在传 了变化,已经不是原来的大脑了。所以获得类人 递机制上依然是二进制的。这使得它们始终无法 智能的唯一途径,可能就是需要不断地从外界进 做到与大脑一样的高效和低功耗。量子计算机圆 行刺激,即学习的过程。 中的量子比特则是在信息的表示和传递的彻底革 如果学习是获得类人智能的必要途径,那首 新。或许这些技术的进步能够给类脑智能带来新 先需要有一个像大脑一样可学习的装置,然后就 是学习的过程。当前,深度神经网络充当这个可 的途径,并从根本上改变现有的人工智能架构。 九问:记忆、计算和存储的区别是什么?能 学习的装置,而各种学习算法和数据充当的就是 不能说,记忆智能和计算智能都不可或缺?利用 这一学习的过程。当然深度神经网络目前远没有 自己记忆中的经验解决当前的一个智力问题也 大脑那般的可塑性,当前的学习算法和数据与我 们的家-校-社会三位一体的教育体系也完全不在 好,利用知识去分析推理解决也好,如何建立整 个数量级。 体的工作机制? 对于学习装置,我们目前没办法复刻一个生 李院士认为:记忆是新一代人工智能的核心, 物学上的大脑,因此尝试用计算机或电子电路去 记忆比计算重要得多,记忆是对计算的监督和约 模拟人的大脑。对于学习过程,新一代人工智能 束,认知网络具有多索引并行机制,可通过检索 就需要考虑为机器人借用我们现有的教育体系, 引擎直接提取记忆,因为有注意力选择机理,它 还是为其再造一个教育体系。就比如AlphaGo, 要比临场的思维、推理、计算快得多。记忆早于 最初的版本还从一定程度上利用到了人类的棋谱回 计算,记忆优于计算,记忆约束计算,记忆随学习 而AlphaGo Zerol就能够完全独立于人类的围棋 与时俱进。 教育体系。即便是重用我们现有的教育体系,那 从某种程度上说,记忆是知识的表示形式。 也是完全不一样的方法,毕竞让机器人像人一样 获得记忆就是从信息中提取知识,使用记忆就是 慢慢地学习成本太高。需要用到强大的学习装 根据知识做出决策,这些在计算机上实现的时候 置,让十几年的教育能够缩短在几天内完成。 都需要计算。因此不应该把记忆和计算分开对 八问:在新一代人工智能架构的机器人中, 待,二者在智能行为中都是不可或缺的。例如: 基本组成最少可能有哪几种?各部分中的信息产 人工神经网络中,记忆表现为神经网络的参数, 生机制与存在形式是什么?它们之间的信息传递 训练神经网络的过程就是获取记忆的过程,使用 是什么样的? 神经网络的过程就是使用记忆的过程。只是目前 李院士认为:新一代人工智能机器中,由记 神经网络的后向传播的训练方式与人们获得记忆
七问:如何体现新一代人工智能与时俱进的 学习能力? 李院士认为:新一代人工智能也必须具有像 人一样的学习和交互认知的环境才能习得知识, 而不是传统人工智能那样一次性设计而成,也不 是带着特殊预设目的,向机器强制地集中性注入 一个或者多个专门领域的计算智能。 这其实涉及到了人工智能一个最基础的问 题:智能是否能够被记录、存储和传递。自然界 中声音可以、图像也可以,甚至生物个体通过遗 传物质 DNA 也可以被克隆。两个克隆人之间最 初拥有共同的生物基础,也会因为后天的经历不 同表现出不同的智能。假设给我们一个爱因斯坦 的大脑,而我们的生物技术已经发达到能够复刻 一个完全一样的大脑,那么这个大脑是否和爱因 斯坦一样聪明?理论上,同一个软件在不同计算 机上的拷贝应该有完全一样的表现。但复杂如大 脑,这或许是一个不可能的任务,或许像很多量 子现象一样我们进行记录的那一刻大脑已经发生 了变化,已经不是原来的大脑了。所以获得类人 智能的唯一途径,可能就是需要不断地从外界进 行刺激,即学习的过程。 如果学习是获得类人智能的必要途径,那首 先需要有一个像大脑一样可学习的装置,然后就 是学习的过程。当前,深度神经网络充当这个可 学习的装置,而各种学习算法和数据充当的就是 这一学习的过程。当然深度神经网络目前远没有 大脑那般的可塑性,当前的学习算法和数据与我 们的家-校-社会三位一体的教育体系也完全不在 一个数量级。 对于学习装置,我们目前没办法复刻一个生 物学上的大脑,因此尝试用计算机或电子电路去 模拟人的大脑。对于学习过程,新一代人工智能 就需要考虑为机器人借用我们现有的教育体系, 还是为其再造一个教育体系。就比如 AlphaGo, 最初的版本还从一定程度上利用到了人类的棋谱[2] , 而 AlphaGo Zero[7] 就能够完全独立于人类的围棋 教育体系。即便是重用我们现有的教育体系,那 也是完全不一样的方法,毕竟让机器人像人一样 慢慢地学习成本太高。需要用到强大的学习装 置,让十几年的教育能够缩短在几天内完成。 八问:在新一代人工智能架构的机器人中, 基本组成最少可能有哪几种?各部分中的信息产 生机制与存在形式是什么?它们之间的信息传递 是什么样的? 李院士认为:新一代人工智能机器中,由记 忆、交互和计算 3 部件组成,其中的感知、认知与 行为都是双向互动的。记忆、交互和计算 3 部分 之间的信息传递机制和螺旋发展比较复杂,但三 位一体很重要。 同冯诺依曼的计算机体系作类比,记忆可以 看作存储,交互是键盘、鼠标、屏幕等这些输入输 出外设,而计算则是 CPU。记忆系统里有瞬时记 忆、工作记忆和长期记忆 3 类子部件,存储系统 中的寄存器、内存和硬盘分别负责瞬时、工作和 长期的存储。计算机的记忆与人的记忆最大的区 别其实在于信息的表示方式。计算机采用的是二 进制进行存储和运算的,所有的信息都需要以一 定的方式编码成二进制。而记忆在人脑中是以神 经元突触的连接形式来实现的。 人工神经网络从某种意义上可以看作是在二 进制的计算机系统中模拟神经元的记忆机制。从 计算效率上看,这是低效的。所以有了关于“类 脑”芯片的研究,希望能够提高模拟的效率。这些 “类脑”芯片虽然在连接上模拟神经元,但是在传 递机制上依然是二进制的。这使得它们始终无法 做到与大脑一样的高效和低功耗。量子计算机[8] 中的量子比特则是在信息的表示和传递的彻底革 新。或许这些技术的进步能够给类脑智能带来新 的途径,并从根本上改变现有的人工智能架构。 九问:记忆、计算和存储的区别是什么?能 不能说,记忆智能和计算智能都不可或缺?利用 自己记忆中的经验解决当前的一个智力问题也 好,利用知识去分析推理解决也好,如何建立整 体的工作机制? 李院士认为:记忆是新一代人工智能的核心, 记忆比计算重要得多,记忆是对计算的监督和约 束,认知网络具有多索引并行机制,可通过检索 引擎直接提取记忆,因为有注意力选择机理,它 要比临场的思维、推理、计算快得多。记忆早于 计算,记忆优于计算,记忆约束计算,记忆随学习 与时俱进。 从某种程度上说,记忆是知识的表示形式。 获得记忆就是从信息中提取知识,使用记忆就是 根据知识做出决策,这些在计算机上实现的时候 都需要计算。因此不应该把记忆和计算分开对 待,二者在智能行为中都是不可或缺的。例如: 人工神经网络中,记忆表现为神经网络的参数, 训练神经网络的过程就是获取记忆的过程,使用 神经网络的过程就是使用记忆的过程。只是目前 神经网络的后向传播的训练方式与人们获得记忆 ·657· 李向阳,等:浅评《新一代人工智能十问十答》 第 3 期