点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
近年来,人工智能技术正高速演进。其蓬勃发展态势,离不开背后算力的支撑。近日,北京大学团队在智能计算硬件方面取得领先突破,实现了基于存算一体技术的高效排序硬件架构,解决了传统计算架构面对复杂非线性排序问题时计算效率低下的瓶颈问题。该成果已在国际顶级学术期刊《自然·电子》上发表。
排序,作为人工智能系统中最常用、最耗时的基础操作之一,广泛存在于自然语言处理、信息检索、图神经网络、智能决策等人工智能相关领域中。
比如,在智能驾驶场景中,车辆在高速公路等简单环境中,只需对周边几台车的行进路线进行排序,就能判断是否会对自身安全产生影响,整个耗时可控制在毫秒级别,但在复杂的城市环境中风险来自周边的数百个乃至更多的各类交通参与者,排序的复杂程度和硬件延迟大幅提高。
然而,在传统计算架构下,大规模的非线性排序难以在端侧或边缘设备高效完成,这一过程消耗大量时间与功耗,极大制约了具身智能、智能驾驶等新兴技术的发展与普及。
近年来,“存算一体”被认为是突破传统硬件架构计算瓶颈的关键技术,已经在矩阵计算等规则性强的数值计算中取得显著成果。然而,由于排序存在逻辑复杂、操作非线性、数据访问不规则,缺乏通用、高效的硬件排序原语等诸多障碍。该科研团队围绕“让数据就地排序”的第一性原理目标,在存算一体架构上攻克了多个核心技术难题,实现了排序速度与能效的数量级提升。
在人工智能系统中,排序通常作为数据预处理或决策中间环节存在,一旦执行效率不高,将成为整个系统的一大瓶颈。论文第一作者、北京大学集成电路学院博士生余连风介绍,排序的核心是比较运算,需要精准地实现“条件判断+数据搬移”,在复杂的应用场景中,要对不同因素的优先级进行比较,因此排序的逻辑非常复杂。我们的工作解决了这一难题,设计了一种“无比较器”的存算一体排序架构。
论文通讯作者、北京大学人工智能研究院研究员陶耀宇说:“正因为排序计算在人工智能中是高频、通用、基础且极难处理的一类操作,这一难题的突破意味着存算一体从‘适合特定应用’走向‘可支持更广泛的通用计算’,为人工智能相关任务构建了全链路的底层硬件架构支持。”
据了解,该技术具有广泛的应用前景,可用于智慧交通图像排序系统、金融智能风控评分引擎、边缘监控设备的目标优先识别模块等场景。比如,在智慧交通场景中,系统有望在毫秒级内完成十万级事件优先级评估,为超大规模交通决策、应急响应调度等提供高效的实时算力支持。
当前,随着人工智能技术正与物理世界加速融合,算力已从“服务算法”演变为“主导能力边界”的战略资源。“在社会层面,有望推动新一代智慧交通、智慧医疗、智能制造、数字政府等系统更加高效运行,释放数据价值,助力新质生产力形成。”陶耀宇说。(记者 李政葳)