多模态能力再升级让视频创作更便捷

来源：光明网2023-08-16 13:12

　　8月15日，讯飞星火认知大模型V2.0升级发布会上，科大讯飞董事长刘庆峰对讯飞星火的多模态能力进行重磅发布，讯飞星火在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。他表示，“讯飞星火的多模态能力在业界可测的大模型中明显领先。”

多模态能力再升级让视频创作更便捷

　　刘聪现场继续真机实测，让星火大模型现场“读图”，生成人物、风景等各类照片，生成班级手抄报，还能根据古诗词“作画”，“智商”在线。星火还能进行虚拟人短视频的生成，“创作一篇立秋抒情散文，并用一个短发民国风的女生形象生成视频”，他话音刚落，一个身穿民国风格的女生站在不断切换的秋天美景前娓娓道来。

　　发布会上多模态能力升级后的产品——讯飞智作2.0也正式发布，无论是视频的后期处理还是创意视频生产，搭载了讯飞星火核心能力的讯飞智作2.0都能轻松搞定，不仅进一步降低了短视频制作的门槛，满足更多元的视频制作需求，也将为AIGC带来前所未有的产业机会。

　　对于升级多模态能力，刘庆峰重点介绍了两点。“多模态能力是赋能行业的刚需，也是实现通用人工智能的必经之路。”他强调，当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域，它可以从真实世界获得越来越多的数据，在产品终端有学习、训练和提升，包括更柔性更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等。（曾震宇）

[ 责编：李飞 ]

阅读剩余全文（）