点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
当前,我国大模型发展处于什么阶段?面临着哪些发展瓶颈?未来面临哪些趋势?在第六届“北京智源大会”期间,记者采访了智源研究院院长王仲远。他表示,未来,大模型将以数字智能体的形态与智能硬件融合,以具身智能的形态从数字世界进入物理世界;同时,大模型这一技术手段可为科学研究提供新的知识表达范式,加速人类对微观物理世界规律的探索与研究突破,不断趋近通用人工智能的终极目标。
记者:当前我国大模型如雨后春笋般涌现。从整体上看,它们处于什么样的“位置”?
王仲远:目前,国内的国产大模型在过去这一年取得了长足进步,国产大模型平均水平已超过GPT 3.5,接近GPT 4,甚至在中文语境下某些能力已超越了GPT 4。尽管GPT 4不断迭代更新,国产大模型仍在追赶,但追赶上GPT 4是重要里程碑。
当我国大模型达到GPT 4水平后,中国的场景和数据优势将显现,大模型真正可以变成赋能千行百业的新质生产力,推动各行业生产力的发展。从总体来看,对于普通用户来说,目前国产大模型已达到了“可用”水平,但还未到达“好用”水平,仍需不断努力提升。
记者:在现阶段基础上,明年的大模型的主要应用场景会是什么样?
王仲远:语言大模型的发展已经具备了通用人工智能非常核心的理解和推理能力,并且形成了一条以语言大模型为核心对齐和映射其他模态的技术路线,从而让模型具备了初步的多模态理解和生成能力。但这并不是让人工智能感知、理解物理世界的终极技术路线,而是应该采取统一模型的范式,实现多模态的输入和输出,让模型具备原生的多模态扩展能力,向世界模型演进。
从整体上看,目前的国产大模型接近GPT4的能力,预计未来两三年大模型在B端和C端将出现大量应用。2023年以后,AI进入了通用时代,其泛化性、通用性、跨领域的特性,几乎可以影响所有行业,尤其在文案处理、创意内容生成等领域。此外,大模型的出现也使得金融、医疗、教育等行业都将受益。
记者:如何看待大模型“降价潮”?
王仲远:某种程度上的降价,对于开发者开发自己的应用场景,尝试接入更多大模型,肯定具有一定的价值。“降价潮”有利于开发者探索新的应用场景,并更广泛地使用大模型,同时也可能带来一些挑战。大模型的迭代需要大量资金投入,如果最后低于实际成本,可能会影响大模型的持续发展。因此,我更倾向于看到它找到自己的产业模式、商业模式,最终形成一个健康的产业生态和可持续的发展模式。
开发者当前在选择大模型时,主要考虑的是,其是否真正具备人工智能的能力为产品赋能,而不是性价比。随着大模型的普及和规模效应的显现,其价格自然会合理化,最终达到一个合理的水平。因此,较为理性客观的开发者不会过于看重价格作为选择因素。
记者:当前AI技术大火,但对于普通用户来说,依旧缺乏能产生真正突破的应用。目前的大模型是否也在“卷参数”“卷应用”?
王仲远:我们不能高估技术革命的速度,但也不能低估一次技术革命的深度和广度。如果说以大模型为基础的通用人工智能技术,是真正意义上的第四次工业革命,那么它将持续影响几十年,深层次改变人们生活方方面面。就像对于自然语言理解的人工智能研究,已有近20年的时间,但是对文字的理解和推理,还有好多最本质、最深层的问题,至今仍一直没有被解决。
此外,所谓技术的突破可能发生在一瞬间。虽然当下主流媒体或自媒体可以实现信息的爆炸式传播,使得大家对于技术感知更明显,然而大部分用户可能还是在学习曲线后期才能意识到这些变化。因此,“杀手级”应用的出现是不可避免的,只是大多数用户可能在其出现后才会注意到。
记者:智能手机已成为生活的必需品,它与大模型的整合进展到了哪个阶段?
王仲远:目前,智能手机的硬件能力仍然受限,无法搭载真正意义上的大模型。虽然能够运行一些轻量级的模型,但是它的智能化水平,它能解决问题的能力,显然比强大的大模型相差不少。真正的大型模型仍然难以实现完全在智能手机上运行。因此,我认为,大模型与手机端的结合还处在非常早期的阶段。
未来,促进两者的进一步整合需要提升大模型能力,或转为能达到同等效果的百分之八九十的轻量化模型。如果一个轻量级模型能够达到顶尖大型模型的90%的能力,那么在移动端和PC端才可能会出现爆发性的使用。因此,真正出现“杀手级”的应用需要天时地利人和。(实习生 马境远 记者 李政葳)