点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
清华大学计算机科学与技术系教授、人工智能研究院常务副院长 孙茂松
“近十年来,自然语言处理发展迅猛,从Word2Vec到ChatGPT,实现了自然语言处理从离散符号系统到连续向量空间的技术范式革命,但仍存在词表示和句子表示机制不完善、语言模型与知识系统结合不紧密的突出问题。”清华大学计算机科学与技术系教授、人工智能研究院常务副院长孙茂松表示。
2023年世界互联网大会乌镇峰会期间,15项世界互联网大会领先科技奖在现场发布。其中,由清华大学、华为技术有限公司联合申报的基础研究组项目“多层次多元知识融通的自然语言深度学习基础方法”荣获奖项。
孙茂松介绍,项目针对“词级嵌入表示对语言知识综合利用能力不足”“句级语言模型对世界知识主动感知能力不足”“语言模型对知识系统深度利用能力不足”三个深刻挑战,经过持续研究,建立了较为完整的多层次多元知识融通的自然语言深度学习基础方法体系,突破了自然语言深度学习的若干重要瓶颈制约,显著提升了自然语言处理模型的基本能力。
“多层次多元知识融通的自然语言深度学习基础方法”项目经过持续研究,在语言与训练模型中更多的注入了语言知识、世界知识,以及和世界知识的互动,显著提升了自然语言处理模型的基本能力。“但在大模型条件下,所有结论还需重新审视,以便进行更加深入的研究。我们将以此次入选为鞭策,继续努力,行稳致远,为推动人工智能时代自然语言处理领域的发展贡献智慧。”孙茂松说。
· 点击视频,了解更多
“多层次多元知识融通的自然语言深度学习基础方法”发布现场 →
世界互联网领先科技成果发布活动已连续举办7年,在鼓励科技创新、推广技术交流合作方面发挥了重要作用。今年,活动全面升级为世界互联网大会领先科技奖,以表彰互联网领域从业者对领先互联网科技成果作出的突出贡献。
撰文/视频:刘昊、孔繁鑫、曾震宇 编辑/排版:穆子叶 统筹:李政葳