点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
5月13日,腾讯研究院发布《向AI而行,共筑新质生产力——行业大模型调研报告》(下文简称“报告”)。报告剖析了行业大模型发展、应用、实现、治理与未来发展趋势,旨在为业界提供囊括学术、商业、政策等不同视角的全面参考。
“人工智能大模型正在催生新一轮技术创新与产业变革,也将为工业、金融、广电等行业数字化转型和高质量发展带来新动能。当前市场以基础大模型为主,通识能力强,但缺少行业专业知识。如何将大模型融入千行百业,是下一阶段的发展重点。”中国工程院院士邬贺铨在报告序言中提出。
报告提到,所谓“行业大模型”,指的是利用大模型技术,针对特定数据和任务进行训练或优化,形成具备专用知识与能力的大模型及应用。与通用大模型相比,行业大模更专注于提高性价比、增强专业性并保障数据(特别是私有数据)的安全性。
OpenAI提出的“规模定律”(Scaling Law)驱动了大模型的快速发展,传统AI模型参数量通常在数万至数亿之间,大模型的参数量则至少在亿级,并已发展到过万亿级的规模。大模型带来了AI性能突破,也激发业界向通用人工智能(AGI)领域进发的新热潮。
不过,大模型存在专业性、泛化性和经济性“不可能三角”问题,导致目前行业实际落地应用进程并不快。例如,GPT为代表的通用大模型以发展通识能力为主要目标,更侧重泛化性,在专业性和经济性方面目前很难充分满足具体行业的特定需求,因此需要行业大模型来针对性解决。
报告认为,目前行业大模型整体处于发展早期,尚未出现大规模成熟应用的范例。报告中主要聚焦三个问题:一是行业大模型既有模型、也含应用;二是行业大模型大多生长在通用大模型之上,基于通用大模型进行再开发;三是行业大模型具备定制特征,本质是解决方案,而非产品。
在实际应用方面,数字原生行业(如各类互联网应用)是行业大模型应用的先行者,传统行业中生产性服务业(广告、金融等)进展相对快,而重资产行业(建筑、制造、能源等)进展相对慢。《报告》发现,其中有两大核心影响因素是需求的适配度和数据的可得性,越高的行业进展越快。
报告还发现,行业大模型应用场景的快慢呈现“微笑曲线”特征。在产业链高附加价值的两端(研发、设计和营销、服务),大模型应用落地较快。造成这种情况的原因之一是,大模型带来“智力即服务”的范式变化。这种服务特别适配微笑曲线两端的知识密集型和服务密集型领域,而在低附加价值的中部(生产、组装等),大模型应用进程较慢。
报告提出,行业大模型目前主要有四种技术实现方式,从易到难分别是:提示工程、检索增强生成、精调和预训练。实际应用中这些方式通常是组合使用,以实现最佳效果。
其中,提示工程适用于刚接触大模型的企业新手,采用这种方式能以最小资源投入、快速探索应用。局限性也很明显,若大模型内含的行业数据较少,效果较差。
检索增强生成适用于处理企业自有数据,通过大模型外挂知识库,更准确检索并生成知识库范围内的内容。该方式模型本身不会调整,算力等投入就不会太大,已成为部署行业大模型应用的主流选择,局限在于对知识库外的专业问题反馈效果有限。
精调适用于解决行业特定任务,通常是基于特定数据集局部调整模型参数,提高任务处理的效果和效率。精调是对大模型定制优化和成本投入的折中选择,算力和数据等投入明显增加,但比预训练更低。
预训练适用于行业专业性较高、数据类型和任务与主流通用大模型差异较大的情况,例如生物/医药研发。这种方式投入最大,不仅需要收集大量数据,还需要对模型进行全参数训练调整,甚至从头搭建一个模型。
在“人工智能+”等重要政策指引下,行业大模型有望加速在传统行业的落地应用。在“云智一体”的基础设施支持下,行业大模型向多模态、人工智能体、端侧及小型化等方向发展,将更深入嵌入各行业的工作流程中,从而提升生产力。
报告提到,一些与工作流程深度耦合的AI Agent已经开始涌现,有望逐步发展成为各行各业不可或缺的新型生产力工具。同时,随着AI应用的深入,模型的规模、类型和复杂性将不断增加,MaaS(模型即服务)将日益成为行业用户云上用智的主流方式。
用户或直接调用云端的大模型API,或借助全生命周期的大模型训练工具,生成适用于自身场景的大模型,并托管在云上,为最终用户提供高质量智能服务。为此,面向AI的、更高性能的算力底座不可或缺。通过计算、存储、通信、训练等各层面的优化,全面提升模型训练、开发和应用效率。
AI大模型在各行业的应用,将会加速社会共同迈向智能新时代。中国广告协会会长、国际广告协会全球副主席张国华认为,大模型是效率、体验和创造力的倍增器,它正在重塑着广告行业的未来;中国工程院院士李伯虎提出,“AI+制造”能够提高生产效率、提升产品质量、实现个性化定制、优化资源配置、促进绿色环保、实现人才结构优化等,进而加快推进中国工业的五个转型升级,实现工业的数字转型与智能化升级,促进新质生产力形成。(孔繁鑫)