- 通用人工智能标准、评级、测试与架构
- 朱松纯主编
- 3169字
- 2025-05-19 16:33:14
1.1 智能是什么
智能是什么?从非智能体到智能体,最关键的鸿沟在哪里?古往今来,这些问题一直都是人类心灵深处的困惑,宗教、哲学、艺术都试图做出回答。直到认知科学与心理学家将智能定义为一个可测量的研究对象,智能才真正成为科学意义上的一个概念。本节首先介绍智能的心理学定义与测量方法,展示现有丰富的研究成果与存在的不足,然后基于智能现象与物理现象的本质区别,提出一种全新的大统一智能理论。
1.1.1 智能的心理学定义与测量
在关于智能的研究领域中,最大的挑战源自人们对什么是“智能”莫衷一是。智能一般指人类的智力,虽然人们在这方面已有多年的研究历史,但仍然没有形成统一的理论。在早期的心理学研究中,斯皮尔曼的二因素说(Spearman, 1914)把智力分为普遍因素(General Factor,G因素)和特殊因素(Specific Factor,S因素);后期的瑟斯顿(Thurstone, 1946)及加德纳(Gardner, 2011)的多因素论把智力分为语言、推理、数学等多个维度;卡特尔(Cattell, 1987)的认知理论又把智力分为流体智力(Fluid Intelligence)和晶体智力(Crystallized Intelligence)等维度。
在心理测量领域,有许多针对智力的测验方法。智力测验是指在一定的条件下,使用特定的标准化测验量表对被试者施加刺激,从被试者的特定反应中测量其智力的高低。20世纪初,世界上第一个智力量表诞生了,它就是比奈-西蒙智力量表(Binet et al., 1912, 1916),它以斯皮尔曼的二因素说为基础,制定了3~11岁的儿童应达到的能力水平标准,可以测量智力多方面的表现,如记忆、理解、手工操作能力等。第一次世界大战以后,多种智力测验被投入使用,智力测量工具多种多样,如斯坦福-比奈智力量表(Stanford-Binet Intelligence Scale,2003年修订)、韦克斯勒成人智力量表(Wechsler Adult Intelligence Scale,2008年修订)、瑞文标准推理测验(Raven Standard Progressive Matrices,1938年发布)等。这些针对人类智力的测量工具,也为人工智能测验提供了启发。
除了成年人智力的研究,儿童智力发育的研究工作对揭示智能的初始形态和发展过程也起到了至关重要的作用。伊丽莎白·斯佩尔克(Elizabeth Spelke)等人认为人的心智(Mind)由个别的、可以分离的核心知识(Core Knowledge)系统构成(Spelke, 2007),包括客体系统、主体系统、数字系统及空间系统,并提出了一组可能的智能基础维度。对于儿童认知发展的理论,让·皮亚杰(Jean Piaget)做出了突出的理论贡献,他认为所有人类个体都会以固定顺序经历各个认知发展阶段(Piaget, 1952, 1962),假设个体从出生到青春期,都按照固定的4个阶段进行:感觉运动阶段(0~2岁,主动意向反应,理解物体属性)、前运算阶段(2~7岁,将感知动作内化为头脑中的表象性思维)、具体运算阶段(7~11岁,去自我中心,思维可逆)、形式运算阶段(11岁以上,具备抽象思维的能力)。
综上,心理测量与发展心理学为智能包含的维度及智能发展阶段的相关研究做出了重要贡献。然而,对智能的定义至今仍没有统一的结论,多种描述和评价“智能”的系统(如加德纳的智力理论)都未能对智能给出统一的理论解释(Legg et al., 2007)。这些理论侧重被动的能力水平的测量,无法体现出智能自主驱动的学习、探索及任务执行能力。这些基于行为的测试仍然是黑盒试验,并未与智能产生的机理模型或数理模型充分结合。通用人工智能(Artificial General Intelligence,AGI)的架构、认知机理、学习的通信过程必须与智能的评测相互促进,通过高效的评测来指导通用人工智能系统的研发和迭代升级。
1.1.2 智能现象
在自然界中,从“物理”到“智能”的演化是一个连续过程。现代科学研究揭示,从简单的物理运动到化学变化,从无机物到有机物,从无生命(Inanimate)到生命体(Animate Object),从蚂蚁、蜜蜂等简单动物再到复杂的灵长类,最后到人类的持续演化,地球上的生命完成了漫长的演化过程。对此,朱松纯教授团队在《人类感知物理和社会事件的统一心理空间》(A Unified Psychological Space for Human Perception of Physical and Social Events)(Shu et al., 2021)中提出用“生命度”(Animacy)作为标尺来衡量演化的复杂度(Complexity):从无生命到简单生命体,再到复杂智能体,“生命度”越来越强,“智能”也越来越复杂,从而形成一个连续的频谱。
刻画这种智能的演化,可以帮助人们理解智能的定义和维度。试着想象两个小球在无重力环境中运动,如图1-1所示。当看到图1-1(a)所示的两个物体碰撞、弹开时,人们感受到的是物理运动现象,可能会想到物体的质量、动能、作用力及运动轨迹等特性。但是,当图1-1(b)(c)所示的智能体与物体(或智能体)开始一前一后“你追我赶”,不断追逐、逃脱时,似乎演绎出了一个“爱恨交织”,甚至“惊心动魄”的故事。人们能感受到,图1-1(a)中的物体是“死”的,图1-1(b)(c)中的智能体是“活”的,这是为什么呢?原因就在于图1-1(a)中的物体碰撞是简单的物理现象,而图1-1(b)(c)中的智能体有了自己的“目标”和“追求”,显现出复杂的智能现象(Shu et al., 2021)。

图1-1 智能体与非智能体的区别
本书提出,智能是智能体在与环境和社会交互并完成大量任务的多尺度、多维度过程中表现出来的各种现象。智能现象是复杂的、多样的,可以按照不同的标准进行相应的类型划分。例如:按照功能的差异,智能现象表现为运动、感知、认知、数字感(Number Sense)、记忆、心智、具身等。根据领域的不同,智能现象可以分为计算机视觉、自然语言处理、机器学习、机器人等。根据国务院2017年发布的《新一代人工智能发展规划》,人工智能的发展重点包括5类:大数据驱动知识学习、跨媒体协同处理、人机协同增强智能、群体集成智能及自主智能系统。智能现象在不同角度、不同维度、不同尺度都有着丰富的内涵,可以说是“横看成岭侧成峰”。
智能现象与物理现象有相似之处,这两类复杂现象的背后分别存在着起支配作用的运行原理。例如,迄今为止人们观察到的所有关于物质的物理现象,在物理学中都可用万有引力、电磁力、强相互作用力、弱相互作用力这4种基本的相互作用机制来描述和解释。著名的大统一理论(Grand Unified Theory,GUT)假说,就是通过研究各种物理现象之间的联系与统一,试图构建出能够统一说明不同物理现象的理论或模型。本书提出,各种复杂的智能现象背后同样存在着相应的基本原理和“大统一模型”。
与由非智能体相互作用形成的物理现象相比,智能现象具有显著的“生命度”特点。从非智能体的机械运动现象中,我们无法得出任何与意图、意志、价值选择等相关的结论。非智能体的运动是受外力影响的被动结果,不是自主发起的行动,它们遵循物理原理,但不包含基于价值的驱动和由因果关系形成的选择。各种智能现象的产生均须依赖两个前提条件:价值链条(Value Chain)和因果链条(Causality Chain)。价值链条是生物进化和生存的“刚需”,如个体的生存、温饱和安全问题,以及物种传承需求。这些基本任务(或需求)会衍生出大量的其他任务。行为是被各种任务驱动的,任务的背后则隐藏着价值函数(Value Function)和决策函数。大多数价值函数在进化过程中就已经形成了,包括在人脑中发现的执行奖惩机制的各种化学成分,如多巴胺(兴奋、快乐)、血清素(愉悦、调节恐惧、缓解焦虑)、乙酰胆碱(焦虑、不确定性)、去甲肾上腺素(新奇、兴奋)等。在价值链条的基础上,智能体需要理解物理世界及其因果链条,以适应这个世界。基于自然和社会规律,因果链条决定了任务完成的路径,为任务的实现设定了限制。然而,当前被社会广泛认知的、基于大数据的人工智能,大多忽视了智能现象背后的核心要素——价值和因果。在许多相关任务中,大模型无法体现出让人满意的、根植于真实物理-社会场景的价值驱动和因果理解。
物体的运动是机械的,是由各种力和相互作用驱动的,可以被一组效用函数(Potential Function,用U表示)描述;智能体的活动是自主的,由价值函数(Value Function,用V表示)驱动,这是智能体和物体最本质的区别。本书认为,智能现象包括两个部分。
(1)理(能力):自然的模型(物理)和社会的规范(伦理),可以由一组效用函数U表达。
(2)心(价值):由认知架构(Cognitive Architecture)和一组价值函数V表达。
每个智能体由(U,V)函数来刻画。智能科学的研究方法就是通过构造认知架构与函数U、V,研究它们在模型空间的计算关系,以解释各种智能现象。