点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:为通用人工智能搭建新测试体系
首页> 数字化频道> AI+ > 正文

为通用人工智能搭建新测试体系

来源:光明日报2023-11-30 16:26

  近来,大模型技术引发了全球对通用人工智能的广泛关注,在产业界、科研界掀起了巨大热潮。在人工智能技术大显身手、取得瞩目成就的同时,如何应对技术跨越所带来的风险并进行管控与治理,如何判断人工智能系统是否具备通用人工智能的性能等,也日益成为各方关注的焦点。在笔者看来,当下,我国科学界和产业界要抓住这一历史机遇,明确通用人工智能的发展路径和方向,牢牢把握解读和评估通用人工智能的话语权,尽快搭建并完善通用人工智能测试评级标准与平台。

  在建构人工智能评测系统方面,早在1950年,英国计算机科学家阿兰·图灵就提出了基于行为的图灵测试:如果一台机器能够与人类展开对话而不被人类辨别出其机器身份,则称这台机器通过了测试。人工智能发展至今,现有的人工智能测试体系各自所呈现出的局限性,已无法满足通用人工智能的研究诉求:图灵测试不足以准确衡量人工智能的智能程度、任务导向测试(俗称“刷榜”),可能导致人工智能过度适应某项特定任务,当前很多基于Unity(一种实时三维互动内容创作和运营平台)的虚拟环境测试则在模拟复杂物理交互方面有所欠缺……显然,传统的人工智能测试已不适用于通用人工智能系统的评级。

  另外,很多应用者反映,当下热门的大模型常常出现“脑雾”与“认知眩晕”等现象,在产业落地中出现问题。归根结底,是因为这种基于数据驱动的大模型仍然缺“心”,缺乏明确的认知架构和价值体系,只能按照人类设定的程序,机械地对问题进行反馈,求解“填空题”。这也倒逼通用人工智能测试之“心”要具备两个结构:其一为价值体系,具备符合人类价值观的通用智能体,才能被广泛接纳;其二为认知架构,这是通用智能体与人交流、合作的基础。价值体系、认知架构不仅应是驱动通用人工智能自主任务生成的根本内驱力,也是保障通用人工智能安全运转的关键。智能体只有具备了“良知”的知识体系及可以与人类沟通解释的“认知架构”,才能形成人机信任关系,实现人机和谐共生。

  针对科学测试人工智能所需的种种条件,近期,笔者带领团队依据发展心理学和心智理论,参考人类婴幼儿发育的测试标准,研究总结出一种基于能力和价值的通用人工智能评测方法,并开发了复杂动态的物理场景(模拟仿真)和社会交互(混合现实)的测试平台——通智测试。这项成果于今年8月发表在中国工程院院刊《工程(英文)》上,这也是该领域发布的全球首个评级测试标准与平台。

  该测试强调在复杂动态的物理及社会环境中,通用人工智能系统(智能体)应满足三个基本标准:

  一是能完成无限任务并具备任务泛化能力,不依赖人类定义和训练任务。任务被定义为智能体对物理世界属性(如颜色、位置、速度等)或社会状态(如感知、认知、决策、心智等)状态的改变。人类在与外界交互时会产生无限可能,通用智能体需在这些场景中理解人类意图、与人协作,其任务和运动的规划必须符合物理因果与社会规范。

  二是能根据变化的场景自主生成任务,不依赖于人类分配任务,做到俗话说的“眼里有活”。反之,如果智能体只能执行人类提前设定好的任务,不论是基于规则或者统计模型,既不能对预设之外的任务做到自主定义,也无法在与陌生环境交互中自动生成新任务,并不能适应人类社会的动态性与多样性。

  三是由价值驱动并具有自我意识和层次化的价值体系。智能体能够自主生成并完成符合人类需求的任务,一套合适的价值系统至关重要。这套价值体系必须融入人类价值观,使智能体有能力学习和理解人类的价值偏好,并最终实现与人类价值的同向甚至对齐。例如,如果儿童提出不安全的要求,智能体能否识别出任务的不合理之处,并自主形成新任务。

  通智测试从智能体探索和认知世界规律的各自感知、认知、运动、交互、社会、学习等能力,以及对自我、他人和群体的价值理解学习这两个角度入手,搭建了具体可行的测试平台架构。测试全面考虑了通用人工智能的关键特征,填补了通用人工智能评测的空白,突破了传统图灵测试的方法局限,在人工智能领域具有创新价值:不但有助于指导研究者为通用人工智能构建综合的设计架构与完善的评估体系,而且能为人工智能安全治理问题提供积极的解决方案。

  在通智测试评估体系下,管理者可针对不同水平的智能体制定差异化监管准入机制,对通用人工智能规范化发展具有参考意义。此外,通智测试评级机制还可以为通用人工智能的科研路径提供明晰可靠的路线图,协助相关领域研究者找准科研道路上的前进方向。

  (作者:朱松纯,系北京通用人工智能研究院院长,北京大学智能学院、人工智能研究院院长)

[ 责编:李飞 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平同普京共同出席“中俄文化年”开幕式

  • 2024年奥运会资格系列赛上海站气氛浓

独家策划

推荐阅读
奔跑吧·少年2024年内蒙古自治区棒垒球邀请赛在鄂尔多斯市康巴什区开赛。
2024-04-20 17:03
4月2日,随着57652次检测车从南充北站5道缓缓驶出,标志着新建汉中至巴中至南充铁路南充至巴中段(以下称"巴南高铁")启动联调联试,进入工程验收关键阶段,为全线早日开通奠定了坚实基础
2024-04-03 15:11
为切实织密森林“防火网”各地组织人员巡查防火。
2024-04-03 15:11
2024年3月31日,“知音湖北 遇见浪漫孝感”春赏花活动在湖北省孝感市金卉庄园景区启动。金卉庄园花团锦簇,五彩斑斓花卉竞相绽放。人们穿梭在花海之间,享受明媚春光。
2024-04-02 15:40
2024年3月23日,由中国服装设计师协会主办的2024秋冬中国国际时装周在北京开幕。
2024-03-26 21:07
3月17日,原创独立设计师品牌SHANG1 BY SHANGYI 2024秋冬系列时装发布会在北京举行。
2024-03-18 16:39
2024年2月28日,新疆维吾尔自治区巴音郭楞蒙古自治州博湖县境内的博斯腾湖出现推冰景观。
2024-02-29 18:59
云南省曲靖市罗平县马街镇钻天坡,盛开的油菜花梯田在初升太阳映照下,勾勒出一幅田园春景图
2024-02-23 10:59
美丽的三亚湾
2024-01-20 17:42
2024年1月12日,江西省吉安市吉州区庐陵文化生态园层林尽染,色彩斑斓,市民徜徉其间,尽享生态之乐。
2024-01-13 19:43
2023年12月26日,在云南省红河哈尼族彝族自治州元阳县新街镇黄草岭村附近,游客在冬樱花与梯田边游览。
2023-12-26 15:39
2023年12月12日,新疆哈密市巴里坤县第十九届冰雪文化旅游节采冰仪式在高家湖二渠水库进行。仪式主要展示了"头冰"的开采上岸过程。开幕式上还举行迎风旗、祈福词、喝出征酒等仪式。
2023-12-13 16:08
2023年12月13日,河北省正定古城迎来降雪,古城内外银装素裹,犹如一幅淡雅的水墨画,美如画卷。
2023-12-13 15:59
2023年11月28日,贵州省六盘水市明湖国家湿地公园层林尽染,景色迷人。
2023-11-29 15:42
2023年11月28日,江西吉安长塘镇中心小学,老师指导学生剪纸。
2023-11-29 15:42
三角梅原产于巴西,现主要分布在中国、秘鲁、阿根廷、日本、赞比亚等国家和地区。其中,以海南三角梅最为出名。
2023-11-29 11:13
2023年11月23日清晨,朝霞初现,三峡库区湖北省宜昌市秭归县沿江公路G348国道的绝壁岩体上,工人们正在铺设防护网,以防止岩崩和落石。
2023-11-24 15:15
2023年11月23日,黑龙江哈尔滨,哈尔滨站工作人员正在清理站台积雪。
2023-11-23 16:02
2023年11月21日,甘肃敦煌,首趟"敦煌号"铁海联运国际货运班列装载1000吨石棉驶出,经天津港通过铁海联运发往泰国曼谷。
2023-11-21 16:55
2023年11月21日,江苏省如皋市龙游河生态公园,色彩斑斓的树木与一河碧水相应成趣。
2023-11-21 16:55
加载更多