点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
第七届世界智能大会“遇见智能”系列之“打卡黑科技”
随着ChatGPT、文心一言、星火认知大模型等众多人工智能大模型的出现,大语言模型在理解人类意图、实现内容生成等方面涌现出了较强的能力,但其在垂直领域的效果还无法满足某些场景的需要。
近日,在第七届世界智能大会智能科技展的现场,由北京大学软件工程国家工程研究中心研发,具备语义理解与自动问答能力的百亿级参数法律领域预训练语言模型LawChat吸引了观众的目光。据北京大学展台讲解人员、擎盾科技产品经理乔元杰介绍,LawChat的实现基于中心自研的大模型开发系列工具,为数据搜集、模型训练、模型评估等重要环节提供了完整工具栈。
该模型采集了海量通用中文语料以及包括裁判文书、合同、司法考试、法律问答等数据在内的法律领域语料,并融合超过包括1.64亿法律实体的领域知识图谱,利用大规模预训练与指令微调技术,构建了LawChat的意图理解与内容生成能力。
目前,LawChat作为一款垂直领域的人工智能大模型,已为包括公检法司、律所、公司在内的3000多家单位提供了智能化公共法律服务产品以及解决方案,为智慧司法的建设提供了技术支撑。
未来,人工智能大模型应如何赋能法律垂直领域?北京大学软件工程国家工程研究中心副教授叶蔚表示,在大模型时代,垂直领域的数据与知识可以有两种利用方式,一是在基座大模型预训练过程中考虑中文领域数据的训练以及相应的架构与工程优化;二是借鉴InstructGPT和Copilot,结合领域数据与知识图谱设计合适的指令微调机制充分激发底座模型能力,在零样本和复杂样例处理上等场景下实现领域任务能力的“跃迁”。
“考虑算力与工程等因素,可以从第二种开始,逐步走向第一种和第二种结合的方式。能够将大模型中的‘涌现’能力高效激活并适配到具体领域场景是未来在垂直行业建立竞争力的关键,而高质量领域数据与知识不可或缺,这是一个重要壁垒。”叶蔚说。(记者 雷渺鑫 李飞 刘昊)
光明网、中共天津市委网信办联合出品